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Prefácio 


Álgebra Linear é o estudo dos espaços vetoriais e das transformações 
lineares entre eles. Quando os espaços têm dimensões finitas, as 
transformações lineares possuem matrizes. Também possuem ma- 
trizes as formas bilineares e, mais particularmente, as formas qua- 
dráticas. Assim a Álgebra Linear, além de vetores e transformações 
lineares, lida também com matrizes e formas quadráticas. São nu- 
merosas e bastante variadas as situações, em Matemática e em suas 
aplicações, onde esses objetos ocorrem. Daí a importância central da 
Álgebra Linear no ensino da Matemática. 

O presente livro apresenta uma exposição introdutória de Álge- 
bra Linear. Ele não pressupõe conhecimentos anteriores sobre o as- 
sunto. Entretanto convém lembrar que a posição natural de um tal 
curso no currículo universitário vem após um semestre (pelo menos) 
de Geometria Analítica a duas e três dimensões, durante o qual o 
estudante deve adquirir alguma familiaridade, em nível elementar, 
com a representação algébrica de idéias geométricas e vice-versa. 

Tornou-se quase obrigatório, já faz alguns anos, dedicar as pri- 
meiras sessenta ou mais páginas de todo livro de Álgebra Linear ao 
estudo dos sistemas de equações lineares pelo método da eliminação 
gaussiana, motivando assim a introdução das matrizes e dos deter- 
minantes. Somente depois disso são definidos os espaços vetoriais. 

Esse costume não é seguido neste livro, cuja primeira sentença 
é a definição de espaço vetorial. Mencionarei três razões para isso: 
(a) A definição de Álgebra Linear dada acima; (b) Não vejo vantagem 
em longas motivações; (c) Sistemas lineares são entendidos mais in- 
teligentemente depois que já se conhecem os conceitos básicos de 
Álgebra Linear. De resto, esses conceitos (núcleo, imagem, base, 
posto, subespaço, etc), quando estudados independentemente, têm 
muitas outras aplicações. 


O método da eliminação gaussiana é apresentado na Seção 9 e 
retomado na Seção 17. Ele é aplicado para obter respostas a vários 
outros problemas além da resolução de sistemas lineares. 

O livro é dividido em vinte e duas seções. As oito primeiras de- 
senvolvem os conceitos fundamentais e as proposições básicas, que 
formam a linguagem mínima necessária para falar inteligentemente 
sobre Álgebra Linear. A nona seção faz a primeira aplicação dessas 
idéias, tratando da eliminação gaussiana. 

A partir da Seção 10, os espaços dispõem de produto interno, 
o que possibilita o emprego de evocativas noções geométricas como 
perpendicularismo, comprimento, distância, etc. São destacados 
tipos particulares de operadores lineares, cujas propriedades 
especiais são demonstradas nas Seções 13, 14 e 15. O Teorema 
Espectral para operadores auto-adjuntos é provado na Seção 13, 
onde se demonstra também o Teorema dos Valores Singulares 
(Teorema 13.10), cuja grande utilidade não corresponde à sua cons- 
pícua ausência na maioria dos textos elementares. 

Outro assunto igualmente importante e igualmente esquecido 
no ensino da Álgebra Linear é a pseudo-inversa, que expomos na 
Seção 16. Trata-se de um tópico fácil, atraente, de grande apelo 
geométrico, que constitui um bom campo de aplicação para os con- 
ceitos anteriormente estudados. 

A Seção 17 é um interlúdio matricial, onde se mostra como as 
propriedades das transformações lineares estudadas antes se tradu- 
zem imediatamente em fatos não-triviais sobre matrizes, principal- 
mente algumas decomposições de grande utilidade nas computações. 


As formas bilineares e quadráticas são estudadas na Seção 18, 
onde é estabelecida a correspondência fundamental (isomorfismo) 
entre formas e operadores (Teorema 18.2) e provado o Teorema dos 
Eixos Principais (Teorema 18.3), que é a versão do Teorema Espec- 
tral para formas quadráticas. É ainda exposto o método de Lagrange 
para reduzir uma forma quadrática a uma soma (ou diferença) de 
quadrados e é feito um estudo das superfícies quádricas. 

Os determinantes são estudados na Seção 19, onde se define di- 
retamente o determinante de um operador sem recurso a bases nem 
matrizes. Em seguida, o determinante de uma matriz n x n é ca- 
racterizado como a única função n-linear alternada de suas colunas 
(ou linhas) que assume o valor 1 na matriz unitária. A colocação dos 


determinantes quase no final do livro, depois de já terem sido es- 
tabelecidos os resultados principais da Álgebra Linear e ensinados 
os métodos mais eficientes para resolver sistemas, inverter matri- 
zes etc, é uma atitude deliberada, que visa pôr esse conceito em seu 
devido lugar. Trata-se de uma noção de grande importância teórica, 
indispensável em várias áreas da Matemática, a qual foi, e ainda 
não deixou inteiramente de ser, equivocadamente considerada como 
instrumento computacional. Usar a Regra de Cramer para resolver 
um sistema linear, ou calcular o determinante de um operador para 
ver se ele é invertível ou não, são métodos que funcionam bem no 
caso 2 x 2, e até mesmo 3 x 3, mas se tornam altamente inviáveis a 
partir daí. 

Depois que se têm os determinantes, o polinômio característico é 
estudado na Seção 20. Esse estudo se completa na Seção 21 com a 
introdução dos espaços vetoriais complexos, nos quais vale o notável 
fato de que todo operador possui autovetores, logo pode ser triangu- 
larizado. Este resultado é devidamente explorado, o que concede a 
esta seção um ar de happy ending para a teoria, mas não o fim do 
livro. 

A seção final, número 22, apresenta uma breve exposição das 
equações a diferenças finitas, essencialmente limitada às equações 
(e sistemas) lineares de segunda ordem. Basicamente, trata-se de 
obter métodos eficazes de calcular as potências sucessivas de um 
operador ou de suas matrizes. 

Esta introdução à Álgebra Linear reflete uma longa experiência 
como usuário do assunto e, nos últimos dez anos, como professor. 
Ao escrevê-la, fui influenciado pelas reações dos meus alunos, suas 
participações nas aulas e suas palavras de incentivo. Um agradeci- 
mento especial por esse motivo é devido aos estudantes da E.P.G.E. 
da Fundação Getúlio Vargas. Agradeço ao meu colega Jonas de Mi- 
randa Gomes por me ter convencido de que ainda havia lugar para 
mais um livro nesta área e por suas sugestões, sempre objetivas, que 
contribuíram para melhorar a comunicabilidade. Agradeço também 
a Wilson L. de Góes pela incrível eficiência e grande boa vontade na 
preparação do manuscrito. 


Rio de Janeiro, maio de 1995 
Elon Lages Lima 


Prefácio da Segunda Edição 


A boa acolhida dispensada à primeira edição, esgotada rapidamente, 
animou-me a fazer nesta algumas modificações, que enumero a se- 
guir. 

Foi feita uma extensa revisão do texto, eliminando-se vários 
erros de impressão, exercícios incorretamente propostos e trechos 
obscuros ou imprecisos. Para este trabalho, vali-me da colaboração 
de diversos leitores, dentre os quais destaco, de modo muito especial, 
o Professor Florêncio Guimarães, que elaborou uma lista minuciosa 
de correções. A todos esses amigos registro meus sinceros agradeci- 
mentos. 

O número de exercícios foi consideravelmente aumentado com a 
inclusão, em especial, de mais problemas elementares de natureza 
computacional, visando fazer com que os leitores menos experientes 
ganhem confiança em si ao lidarem com assuntos novos. 

A Seção 15 foi inteiramente reescrita, passando a tratar dos ope- 
radores normais em espaços vetoriais reais, um assunto fácil, atra- 
ente e muitas vezes negligenciado. A antiga Seção 15 (operadores 
anti-simétricos) tornou-se um mero caso particular. Sem esforço 
(nem espaço) adicional, o tratamento ganhou uma abrangência bem 
maior. 

Atendendo a vários pedidos, acrescentei ao livro um Apêndice 
sobre a forma canônica de Jordan, tratando esse tema de modo sim- 
ples, não apenas sob o ponto de vista matricial mas formulando-o 
também sob o aspecto de operadores. 

Rio de Janeiro, setembro de 1996 
Elon Lages Lima 


Prefácio da Oitava Edição 


Esta edição, além de conter novas correções sugeridas pela atenta 

vigilância do Professor Florêncio Guimarães, deu-me oportunidade 

de acrescentar à lista de indicações bibliográficas o livro do Professor 

Ralph Costa Teixeira, que traz as soluções de todos os exercícios aqui 
propostos. 

Rio de Janeiro, outubro de 2009 

Elon Lages Lima 
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Espaços Vetoriais 


A noção de espaço vetorial é a base do estudo que faremos; é o terreno 
onde se desenvolve toda a Álgebra Linear. Esta seção apresenta os 
axiomas de espaço vetorial, deduz suas consegiiências mais imedia- 
tas e exibe os exemplos mais importantes dessa noção. 


Um espaço vetorial E é um conjunto, cujos elementos são chama- 
dos vetores, no qual estão definidas duas operações: a adição, que a 
cada par de vetores u,v € E faz corresponder um novo vetor u+v E E, 
chamado a soma deu ev, e a multiplicação por um número real, que 
a cada número « € Re a cada vetor v € E faz corresponder um vetor 
«-v, ou «v, chamado o produto de « por v. Essas operações devem 
satisfazer, para quaisquer «, 3 E Reu,v,w € E, as condições abaixo, 
chamadas os axiomas de espaço vetorial: 


comutatividade: utv=v+tu; 
associatividade: (ut+v)+tw=u+(v+w)e («B)v = a(Bv); 


vetor nulo: existe um vetor O E E, chamado vetor nulo, ou vetor 
zero, tal quev+0 =0+v=v para todo v E E; 


inverso aditivo: para cada vetor v E E existe um vetor —v E E, 
chamado o inverso aditivo, ou o simétrico de v, tal que —v + v = 
v+(>v) =0; 


distributividade: (a+B)jv=av+pveca(u+v) = au + av; 


multiplicação por 1: 1.v=v. 


2 Espaços Vetoriais Seção 1 


Observação: O mesmo símbolo O representa o vetor nulo e o núme- 
ro zero. 


Exemplo 1.1. Para todo número natural n, o símbolo R” representa 
o espaço vetorial euclidiano n-dimensional. Os elementos de R” são 
as listas ordenadas u = (0y,...,ân), v = (P1,...,Pn) de números 
reais. 

Por definição, a igualdade vetorial u = v significa as n igualdades 
numéricas «1 = B1,...,0n = Bn. 

Os números «y,..., Ôn são chamados as coordenadas do vetor u. 
As operações do espaço vetorial R” são definidas pondo 


uv= (00 + Pipes es 0 Bad 


a-u= (mag... X4an). 


O vetor zero é, por definição, aquele cujas coordenadas são todas 
iguais a zero: O = (0,0,...,0). 

O inverso aditivo deu = (x3,...,ân) é —u = (—09,...,—0n). 
Verifica-se, sem dificuldade, que estas definições fazem de R” um 
espaço vetorial. Para n = 1, tem-se R! = R = reta numérica. R? é o 
plano euclidiano e Rº é o espaço euclidiano tridimensional da nossa 
experiência cotidiana. 

Para ajudar a compreensão, os vetores de Rº? e Rº podem ser re- 
presentados por flechas com origem no mesmo ponto O. A soma u+v 
é a flecha que liga a origem O ao vértice que lhe é oposto no parale- 
logramo que tem u e v como lados. (Veja Figura 1.1.) 





0 


Figura 1.1 - Soma de vetores. 
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Por sua vez, o produto au é a flecha colinear a u, de comprimento 
« vezes o comprimento de u, com o mesmo sentido deu sea > 0 e 
com sentido oposto se « < 0. 


Exemplo 1.2. Os elementos do espaço vetorial Rº são as sequências 
infinitas u = (01,...,0n,...),V = (By,...,Bn,... ) de números reais. 
O elemento zero de Rº é a sequência O = (0,...,0,...), formada por 
infinitos zeros, e o inverso aditivo da sequência u = (01,...,OQn,...) 
é-—-u = (—-«1,...,—Ôn,...). Às operações de adição e multiplicação 
por um número real são definidas por 


utrv=(0m+PBr... an +PBn,...), 
au= (ua... X4QAn,...). 
Exemplo 1.3. Uma matriz (real) m xn a = [ai] é uma lista de 


números reais a; com índices duplos, onde] <i<mel<j<n. 
Costuma-se representar a matriz a como um quadro numérico com 
m linhas en colunas, no qual o elemento a; situa-se no cruzamento 
da i-ésima linha com a j-ésima coluna: 


1 do Am 
021  Q22 «Am 
Ba Am2 cr: a 
O vetor (ai, aiz,..., ain) E R” é o i-ésimo vetor-linha da matriz a e 
o vetor (a1;, 2;,..., Amj) E R7 é o j-ésimo vetor-coluna de a. Quando 


m=n, diz-se que a é uma matriz quadrada. O conjunto M(mxn) de 
todas as matrizes m x n torna-se um espaço vetorial quando nele se 
define a soma das matrizes a = [ai] e b = [b;;] como a+b = [a;+bi] 


e o produto da matriz a pelo número real « como «a = [xai]. A 
matriz nula O e M(m x n) é aquela formada por zeros e o inverso 
aditivo da matriz a — la] é —a = [ai]. 


Exemplo 1.4. Seja X um conjunto não-vazio qualquer. O símbolo 
F(X;R) representa o conjunto de todas as funções reais f,g: X > R. 
Ele se torna um espaço vetorial quando se definem a soma f + g de 
duas funções e o produto « - f do número « pela função f da maneira 
natural: 

(+ g)lx) = f(x) + g(x), (af)(x) = o f(x). 


4 Espaços Vetoriais Seção 1 


Variando o conjunto X, obtêm-se diversos exemplos de espaços 


vetoriais da forma F(X;R). Por exemplo, se X = (1,...,n) então 
F(X;R) = R”; se X = N então F(X;R) = Rº; se X é o produto carte- 
siano dos conjuntos (1,...,mje(l,...,nj então F(X;R) = M(m x mn). 


Outros exemplos de espaços vetoriais ocorrem como subespaços, 
como veremos a seguir. 

Valem num espaço vetorial, como consequências dos axiomas, as 
regras operacionais habitualmente usadas nas manipulações numé- 
ricas. Vejamos algumas delas. 


1. Sew+u=w-+ventãou =v. Em particular, w-+u = w implica 
u=0ew+u=Oimplicau=-w. 
Com efeito, da igualdade w + u = w + v segue-se que 
u=0O+u=(-w+w)+u 


=-—w+(w+u) 





=-—w+(w+v) 

=(-w+w)+v 

=04+v=v. 
Em particular, w+u = w implica w +u = w+0,logou = 0. E se 
w+u=0entãowtru=w+(—-w) logo u = —w. 
2. Dados0 e ReveEtem-se0-.v = 0 € E. Analogamente, dados 
a«ceRe0etr,valea-0-0. 

Com efeito, v+0-.v=1.v+0-.v=(1+0).v=1.v=v,logo0O-v=0 

como vimos acima. De modo análogo, como «-0-+a«-0 = «-(0+0) = «0, 
segue-se de 1) que « - O = 0. 


3. Sexa£0ev*0entãoa-vz0. 


Com efeito, se fosse a-v = Oentãov = 1.v=(w!.a)y = 
o. (av) =«!.0=0, isto é, teríamos v = 0. 
4(-D)v=—. 

Com efeito, 


v+(Dv=Tv+(-Dv=0+(-1D)D).v=0-.v=0, 


logo (—1)v = —v, pela regra 1. 
No que se segue, escreveremos u — v para significar u + (—v). 
Evidentemente, 
UU v=nou=v+A+M. 
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Exemplo 1.5. Sejam u = (ab) ev = (c,d) vetores em Rº com 
uO0O,istoé,a £0oub 0. A fim de que v seja múltiplo de u, 
isto é, v = ou para algum « E R, é necessário e suficiente que se 
tenha ad — bc = 0. À necessidade é imediata pois v = ou significa 
c= aa ed = ab. Multiplicando a primeira destas igualdades por 
b e a segunda por a obtemos bc = «ab e ad = «ab, logo ad = be, 
ou seja, ad — be = O. Reciprocamente, se ad = bc então, supondo 
a + 0, obtemos d = (c/a)b. Além disso, é claro que c = (c/a)a. Logo, 
pondo «=c/a, vem d = abec=aa, istoév = au. Seforb £0, 
tomaremos « = d/b para ter v = ou. 


Exercícios 


1.1. Dadas as matrizes 
1-1 2 2 30 
a=|; 2 Er b=[2, =3 | 


4 =84 
“o ia 


(a) Calcule a matriz 3a — 2b + c. 


(b) Ache números « e 3, ambos diferentes de zero, tais que «a+ph+c 
tenha a primeira coluna nula. 


1.2. Mostre que as operações definidas no texto fazem realmente dos 
conjuntos R”, M(m xn) e F(X;R) espaços vetoriais. 


1.3. Ache o valor de t que torna a matriz abaixo igual à matriz nula: 


2-1 t—t 
PT t-MA+42 


1.4. Determine os vetores u,v € Rº sabendo que as coordenadas de 
u são todas iguais, a última coordenada de v é igual a3eu+v = 
(1,2,3,4). 


1.5. Dados u = (1,2,3),v = (3,2,0) ew = (2,0,0), ache números «, À 
ey tais que cu+Bv+yw = (1,1,1). 


6 Espaços Vetoriais Seção 1 


1.6. Dados os vetores v; = (1,2,1), vz = (2,1,2), v3 = (3,3,2) e 
va = (1,5,—1) em Rº, determine os vetores u = v; — 3v2 + 2v3 — va, 
vV=V] +v—vy—mew=v— iv— Su. 


1.7. Considere a seguinte afirmação: “Num espaço vetorial E existe 
um único vetor nulo e cada elemento de E possui um único inverso”. 
Qual fato demonstrado nesta seção assegura que esta afirmação é 
verdadeira? 


1.8. Use os axiomas do espaço vetorial E para provar que, sev e Ee 
n é um número natural entãon .v=v+-:-+v (nm parcelas). 


1.9. Sejam u, v vetores não-nulos do espaço vetorial E. Prove que v é 
múltiplo de u se, e somente se, u é múltiplo de v. Que se pode dizer 
caso não suponhamos u e v ambos diferentes de zero? 


1.10. Sejam u = (x3,...,xn) ev = (y7,...,Un) vetores em R?. Prove 
que um deles é múltiplo do outro se, e somente se, x;y; = x;y; para 
quaisquer 1,j=1,...,n. 


1.11. Use as relações 2(u+v) = 2u+2v,2w = w+w para provar 
que a comutatividade u+v = v+u pode ser demonstrada a partir 
dos demais axiomas de espaço vetorial. 


1.12. Em R”, mantenhamos a definição do produto «v de um número 
por um vetor mas modifiquemos, de 3 maneiras diferentes, a defini- 
ção da soma u+v dos vetores u = (xy) ev = (x,y). Em cada 
tentativa, dizer quais axiomas de espaço vetorial continuam válidos 
e quais são violados: 


DD urv=(x+y,x+y); 
(2) u+rv=(x,yy); 
(3) u+v=(3x+3x,5x+ 5x). 


1.13. Defina a média u + v entre dois vetores u, v no espaço vetorial 
E pondo u+v = lu +1v. Prove que (u+v)+w =ux(v+w)se, e 
somente se, U = W. 


1.14. Dados os espaços vetoriais E, E>, considere o conjunto E = 
E, x E, (produto cartesiano de E, por E;), cujos elementos são os 
pares ordenados v = (v1,v2), com vj € E; e vz € Es. Defina operações 
que tornem E um espaço vetorial. Verifique a validez de cada um 
dos axiomas e mostre que sua definição se estende para o caso de 
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n espaços vetoriais Ey,..., En, ou mesmo de uma sequência infinita 
Eis Es,cuos Ensduss 


1.15. Sejam X um conjunto qualquer e E um espaço vetorial. Mos- 
tre que, com as definições naturais, o conjunto F(X;E) das funções 
f: X > E se torna um espaço vetorial. Identifique os casos particu- 
laresem que X =(1,..,n, X=>N,X=AxB,onde À =(1,...,,mje 
B=(1,...,n). 


1.16. Dados os vetores u = (1,2,3), v= (3,21) ew = (-3,2,7) em 
Rº, obtenha números «, P tais que w = au + Bv. Quantas soluções 
admite este problema? 


1.17. Sejam u = (1,1), v= (1,2) e w = (2,1). Ache números a, b, c, 
a”, b”, c”, todos não-nulos, tais que au + bv4+ cw = aqu + bv+ cw, 
coma bp Abçe e. 








1.18. Sejam E um espaço vetorial e u,v € E. O segmento de reta de 
extremidades u, v é, por definição, o conjunto 


lu,vl=((1-tu-+tv; O<t< 1) 


Um conjunto X c E chama-se convexo quando u, ve X> [uv] CX. 
(Ou seja: o segmento de reta que liga dois pontos quaisquer de X 
está contido em X.) Prove: 


Z 


(a) A interseção X; N...M Xm de conjuntos convexos X1,...,Xm EC E é 
um conjunto convexo. 

(b) Dados a,b,c E R, o conjunto X — ((x,y) E R?;ax + by < c) é 
convexo em Rº. 

(c) O conjunto Y = ((xy,z) ER; a<x<b, c<vy< dé convexo 
em Rº. 

(d) Seja X € E convexo. Ser, s, t são números reais > 0 tais que 
r+s+t=lentãou,vweX>rTu+svHtweX. 


(e) Generalizando o resultado acima, a expressão tivi + «+ tv 
onde t;,...,tr são > 0 et; +--- + tr = 1 chama-se uma combinação 
convexa dos vetores vj,...,Vk. Se o conjunto X C E é convexo, prove 
que toda combinação convexa de vetores vj,...,Vvk E X ainda per- 
tence a X. 


1.19. Prove que o disco D = ((x,y) E R2;x? + y? < 1) é um conjunto 
convexo. 
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1.20. Um subconjunto C do espaço vetorial E chama-se um cone 
quando, para todo v € Ce todo t > 0, tem-se tv E €C. Prove: 


(a) O conjunto dos vetores v E R” que têm exatamente k coordenadas 
positivas (0 < k <n) é um cone. 

(b) O conjunto das funções f: X > R que assumem valores negativos 
em todos os pontos de um subconjunto fixado Y Cc X é um cone em 
F(X;R). 

(c) Um cone C c E é um conjunto convexo se, e somente se, u,v E 
C>u-r+vec. 


(d) A interseção e a reunião de uma família qualquer de cones são 
ainda cones. 


1.21. Dado um subconjunto X no espaço vetorial E, seja C(X) o con- 
junto das combinações convexas tyvi +---+tevr (h>0,Lt=1) 
dos elementos de X. Prove que C(X) é um conjunto convexo, que 
X c C(X) e que se C' é qualquer subconjunto convexo de E contendo 
X então €C' > C(X). (Por este motivo, diz-se que C(X) é o menor 
subconjunto convexo de E que contém X. C(X) chama-se a envoltória 


convexa do conjunto X.) 


2 


Subespaços 


Um subespaço vetorial do espaço vetorial E é um subconjunto F C E 
que, relativamente às operações de E, é ainda um espaço vetorial. 
Os subespaços vetoriais constituem uma rica fonte de exemplos de 
espaços vetoriais, como se verá nas seções seguintes. 


Seja E um espaço vetorial. Um subespaço vetorial (ou simples- 
mente um subespaço) de E é um subconjunto F € E com as seguintes 
propriedades: 


1. 0€ F; 
2. Seu,veFentãou-+ve F; 
3. SeveFentão, paratodo « eR, ave F. 


Segue-se que se u e v pertencem ao subespaço F e x, À são 
números reais quaisquer então au + Bv E F. Mais geralmente, dados 
vp. oVmEFeo...,am E Rtem-sev= av ++ amym E F. 

O conjunto (0), com o único elemento 0, e o espaço inteiro E 
são exemplos triviais de subespaços de E. Todo subespaço é, em si 
mesmo, um espaço vetorial. 


Exemplo 2.1. Seja v € E um vetor não-nulo. O conjunto F = (av; a E 
RJ de todos os múltiplos de v é um subespaço vetorial de E, chamado 
a reta que passa pela origem e contém v. 


Exemplo 2.2. Seja E = F(R;R) o espaço vetorial das funções reais 
de uma variável real f:R — R. Para cada k E N, o conjunto C*(R) 
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das funções k vezes continuamente deriváveis é um subespaço veto- 
rial de E. Também são subespaços de E o conjunto Cº(R) das funções 
contínuas, o conjunto C"(R) das funções infinitamente deriváveis, o 
conjunto P = P(R) dos polinômios p(x) = a +ax+-:-+tax" eo 
conjunto P, dos polinômios de grau < n. Paran,k E N quaisquer, 
tem-se: 


C'(R)>CMR)>CHHR)>S COR)D PD Ph. 


Observe que o conjunto dos polinômios de grau n não é um subespaço 
vetorial de E pois a soma de dois polinômios de grau n pode ter 
grau <n. 


Exemplo 2.3. Sejam qa;,...,an números reais. O conjunto H de 
todos os vetores v = (x1,...,Xn) € R” tais que 
axi+:::+ank O 





é um subespaço vetorial de R”. No caso desinteressante em que 
a =--- = q, = 0, 0 subespaço H é todo o R”. Se, ao contrário, pelo 
menos um dos a; é £ 0, H chama-se um hiperplano de R” que passa 
pela origem. 


Exemplo 2.4. Sejam E um espaço vetorial e L um conjunto de 
índices. Se, para cada À E L, F, é um subespaço vetorial de E então 
a interseção 

F=["5 


AEL 


é ainda um subespaço vetorial de E. Segue-se então do Exemplo 2.3 
que o conjunto dos vetores v = (x1,...,Xn) € R” cujas coordenadas 
satisfazem as m condições abaixo 


IX + ax +: +Hanxn O 





21X1 + 099X2 + --- + an O 


AmiX1 + Gmaxz +++ Ama = O 


é um subespaço vetorial de R”, o qual é a interseção F= HN...NFm 
dos hiperplanos F; definidos, segundo o Exemplo 2.3, por cada uma 
das equações acima. 
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Seja X um subconjunto do espaço vetorial E. O subespaço ve- 
torial de E gerado por X é, por definição, o conjunto de todas as 
combinações lineares 


OIVI + agva +++ AmVm 


de vetores vi,...,Vm E X. 

É fácil ver que o conjunto de todas as combinações lineares que 
se podem formar com vetores retirados do conjunto X é, de fato, um 
subespaço vetorial, que indicaremos pelo símbolo S(X). 

O subespaço S(X), gerado pelo subconjunto X C E, contém o con- 
junto X e, além disso, é o menor subespaço de E que contém X. Nou- 
tras palavras, se F é um subespaço vetorial de E e X c F então 
S(X) c F. Evidentemente, se X já é um subespaço vetorial, então 
S(X) = X. Quando o subespaço S(X) coincide com E, diz-se que X é 
um conjunto de geradores de E. 

Explicitamente: um conjunto X é um conjunto de geradores do 
espaço vetorial E quando todo vetor w E E pode exprimir-se como 
combinação linear 

W=0VI+:+amym 


de vetores v1,...,Vvm pertencentes a X. 


Exemplo 2.5. Se v € E é um vetor não-nulo, o subespaço gerado por 
véa reta que passa pela origem e contém v. 


Exemplo 2.6. Sejam u = (a,b) ev = (c,d) vetores de Rº? tais que 
nenhum deles é múltiplo do outro. Então u £ 0, v £ 0 e, pelo Exem- 
plo 1.5, ad — be 0. Afirmamos que X = (u,v) é um conjunto de 
geradores de Rº, ou seja, que qualquer vetor w = (r,s) E R? pode 
exprimir-se como uma combinação linear w = xu + yv. De fato esta 
igualdade vetorial em Rº? equivale às duas igualdades numéricas 


ax + cy =" 
bx+ dy=s. 


Como ad — bc £ 0, o sistema de equações acima possui uma solução 
(x,y), logo existem x,y E R tais que xu + yv = w. Esta mesma con- 
clusão pode também ser obtida geometricamente, conforme mostra a 
Figura 2.1. A partir da ponta de w, traçam-se paralelas às retas que 
contêm u e v, determinando assim os múltiplos xu, yv, que somados 
dão w. 


12 Subespaços Seção 2 





Figura 2.1. 


Exemplo 2.7. Os chamados vetores canônicos 


€1 = (1,0,0,...,0), 
E = [0,1,0,.0040), 


êu=(0,0,0050,1] 


constituem um conjunto de geradores do espaço R”. Com efeito, 
dado v = (w1,...,0Gn) E Rº, tem-se v = qyey + --- + &nen. Analo- 
gamente, os monômios 1,x,...,x”,... (em número infinito) formam 
um conjunto de geradores do espaço P dos polinômios reais. Por 
sua vez, os n + 1 primeiros deles, a saber, 1,x,...,x” constituem 
um conjunto de geradores de Pn, espaço vetorial dos polinômios de 
grau <n. 


Resulta do Exemplo 2.6 que os únicos subespaços vetoriais de R? 
são (0), as retas que passam pela origem e o próprio R?. Com efeito, 
seja F c Rº um subespaço vetorial. Se F contém apenas o vetor 
nulo, então F = (0). Se F contém algum vetor u £ O então há duas 
possibilidades: ou todos os demais vetores de F são múltiplos de u, e 
neste caso F é a reta que passa pela origem e contém u, ou então F 
contém, além de u, um outro vetor v que não é múltiplo de u. Neste 
caso, F contém todas as combinações lineares xu + yv, logo F — R?, 
pelo Exemplo 2.6. 
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Exemplo 2.8. O sistema linear de m equações a n incógnitas 





cn + ta +++ + Gaia = by 














a21X1 + 2x2 +: -- + am = bz 


AmiX1 + Am2x2 + --- + amnXn = bm 


possui uma solução (x1,...,Xn) se, e somente se, o vetor b = (bs, 
«., bm) é combinação linear dos vetores-coluna 


VvIr= Vs Trigo esa) 


Va = (Gm, U2n, ++» Um) 


da matriz a — [ai]. Com efeito, estas equações significam que 
b=xivi + x2v7 + +FXnVa- 


Em particular, se os vetores-coluna v;,...,vn gerarem R”, o sistema 
possui solução, seja qual for o segundo membro b. 


Sejam F, e F; subespaços vetoriais de E. O subespaço vetorial de 
E gerado pela reunião F U F; é, como se vê facilmente, o conjunto de 
todas as somas vj + vz, onde v; E F; e vz E F>. Ele é representado 
pelo símbolo F; + F5. 

Mais geralmente, dados os subconjuntos X,Y C E, indica-se com 
X+ Yo conjunto cujos elementos são as somas u+v, ondeu E Xe 
v € Y. Quando X = (ul reduz-se a um único elemento u, escreve-se 
u+Y em vez de (ul + Y. Diz-se então que u + Y resulta de Y pela 
translação de u. 

Quando os subespaços F,,F; € E têm em comum apenas o ele- 
mento (0), escreve-se | &F, em vez de F;+F, e diz-se queF=H&F 
é a soma direta de F e F5. 


Teorema 2.1. Sejam F, F;, F; subespaços vetoriais de E, com F, C Fe 
F c F. As seguintes afirmações são equivalentes: 


(1) F=H 6 E; 


14 Subespaços Seção 2 


(2) Todo elemento w E F se escreve, de modo único, como soma 
w=vw+v,ondevi cFev e F. 


Demonstração: Provemos que (1) > (2). Para isto, suponhamos 
que H NF, = (0je que se tenha u +u, =v+v, comu,vi E Fe 
u2,v2 E 6. Entãou, — vi; = v; — uz. Como uy —v; E Fev — uz E E, 
segue-se que uy — v; e vz — u, pertencem ambos a F e a F. Mas 
HnFf =(0). Logou —v; =v—u =0,ouseja, Uy = Vj eu2 = vz. 
Para provar que (2) > (1), sejav e E NF. EntãoO+v=v+O0 com 
0,v e Hev,0 € F. Pela hipótse (2), isto implica O = v, portanto 
HnF =(0). 














Exemplo 2.9. Em Rº, sejam F, o subespaço gerado pelos vetores 
ey = (1,0,0,0), e: = (0,0,1,0) e F, o subespaço gerado pelos veto- 
res e» = (0,1,0,0), e = (0,0,0,1). Então F; é o conjunto dos ve- 
tores da forma (w1,0,«3,0) enquanto os vetores de F; têm a forma 
(0, 02,0, 04). É claro que Ré =F, & F. 

A noção de subespaço vetorial abrange as retas, planos e seus 
análogos multidimensionais apenas nos casos em que esses conjun- 
tos contêm a origem. Para incluir retas, planos, etc. que não passam 
pela origem, tem-se a noção de variedade afim, que discutiremos 
agora. 

Seja E um espaço vetorial. Sex,y E Ee x Zy,a reta que une os 
pontos x, y é, por definição o conjunto 


r=((|-t)x+ tyt e Rj. 


Pondo v = y — x, podemos ver quer = (x +tv;t E RJ. 

Um subconjunto V c E chama-se uma variedade afim quando a 
reta que une dois pontos quaisquer de V está contida em V. Assim, 
V c E é uma variedade afim se, e somente se, cumpre a seguinte 
condição: 

myeVvicE=(|-txrtye Mv 


Exemplo 2.10. Um exemplo óbvio de variedade afim é um subespa- 
ço vetorial. Ao contrário dos subespaços vetoriais, que nunca são 
vazios pois devem conter o zero, a definição acima é formulada de 
tal modo que o conjunto vazio a cumpre, logo 2 é uma variedade 
afim. 
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Se Vi,..., Ym C E são variedades afins então a interseção V = 
ViN...M Vm é ainda uma variedade afim. Todo ponto p E E é uma 
variedade afim. 


Exemplo 2.11. Sejam a;,..., an, b números reais. O conjunto H dos 
pontos x = (x1,...,Xn) € R” tais que 


axi+--tanxn=b 


é uma variedade afim (que não contém a origem quando b < 0). Se 
os números a; não são todos nulos, H chama-se um hiperplano. Se 
a =: = qn = 0, tem-se H = 9 quando b Z0e H = R” quando 
b = 0. Mais geralmente, o conjunto das soluções de um sistema 
linear de m equações com n incógnitas (vide Exemplo 2.8) é uma 
variedade afim (eventualmente vazia), interseção das m variedades 
afins definidas pelas equações do sistema. 

O teorema a seguir mostra que toda variedade afim não-vazia V 
pode ser obtida transladando-se um subespaço vetorial F. Diz-se que 
F é o subespaço vetorial paralelo a V. 


Teorema 2.2. Seja V uma variedade afim não-vazia no espaço veto- 
rial E. Existe um único subespaço vetorial F C E tal que, para todo 
x E V tem-se 


V=x+F=(x+vve Ff. 





Demonstração: Dado x E V, seja F o conjunto de todos os vetores 
v=y-x, onde y € V. Mostremos que F é um subespaço vetorial. É 
claro que O E F. Além disso, se «a e Rev e Fentãov = y-—x, com 
y E V, logo 


ov=a(ly—-x)=[(1-o)x+ay-x=z—x, 
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com z = (1 -a)x+ ay E V. Portanto av E F. Finalmente, sev = y—x 
ev =y' — x pertencem a F então 


Eds 
Z=5V+54 EM 
portanto z — x E F. Segue-se daí que a soma 
v+v=y+y —-2x=2(2—x) 


pertence a F. 

Em seguida, mostremos que V = x+F. Comefeito, ye V> y= 
x+(y—x) comy-—x e F,logoy ex+F. Assim, V C x+F. Por outro 
lado, um elemento qualquer de x + F tem a forma x + (y — x), com 
y E V, logo éigualaye daíx+F CV. 

Finalmente, se Fe F' são subespaços vetoriais de E, tais que x + 
F=x+F para algum x € E, provemos que se tem F = F. Com efeito, 
veF5xr+vex+FS5xr+vrex+FP 5 xiv=x+v(VeFf)s5 
v=V > ve F. Portanto F c F. Da mesma forma, vê-se que FC F, 
o que conclui a demonstração. 














Exemplo 2.12. Vimos no exemplo 2.8 que o conjunto V das soluções 
de um sistema linear de m equações com n incógnitas é uma va- 
riedade afim. Supondo V £ &, tomemos xy E V e chamemos de F 
o subespaço vetorial de R” formado pelas soluções do sistema ho- 
mogêneo correspondente (descrito no Exemplo 2.4: veja também a 
página 27). Tem-se V = xo + F. Diz-se então que “todas as soluções 
do sistema se obtêm somando uma solução particular com a solução 
geral do sistema homogêneo associado”. 


Exercícios 


2.1. Seja R(º) o subconjunto de Rº formado pelas segiências v = 
(x1,X2,...,Xn,--.) que têm apenas um número finito de termos xn 
diferentes de zero. Mostre que R(ºº) é um subespaço vetorial de Rº 
e que as sequências que têm um único termo não-nulo constituem 
um conjunto de geradores para R'ºº). 





2.2. Use o índice deste livro para localizar a definição de matriz 
triangular. Mostre que o conjunto F, das matrizes triangulares in- 
feriores e o conjunto F; das matrizes triangulares superiores são 
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subespaços vetoriais de M(n x n), que M(n xn) = H+ Ff e que 
não setem M(nxn) =H €& F. 


2.3. Seja E = F(R;R). Para X c R qualquer, ponhamos 
N(X) =(p E E; q(x) = 0 para todo x E X). Prove: 

(a) Para todo X CR, N(X) é um subespaço vetorial de E. 

(b) XcY5 NY) cN(X) 

(co) N(XUY) = NO) A N(Y) 

(d) N(X) =(0)SX=R 

(e) N(XNY) = N(X) + N(Y) 

O NO) N(Y) -cLESY=R-X. 


2.4. No espaço vetorial E = F(R;R) sejam: 
KH = conjunto das funções f:R — R que se anulam em todos os 
pontos do intervalo [0, 1]; 
F = conjunto das funções g:R — R que se anulam em todos os 
pontos do intervalo [2, 3]. 

Mostre que Fj e F; são subespaços vetoriais de E, que E = F + 
e que não se tem E = H & É. 


2.5. Considere os subespaços H,F> C Rº assim definidos: Fj é o 
conjunto de todos os vetores v = (x,x,x) que têm as três coordenadas 
iguais e F; é o conjunto de todos os vetores w = (x,y,0) que têm a 
última coordenada igual a zero. Mostre que Rº = F, & F. 


2.6. Dados u = (1,2) ev = (—1,2), sejam F; e F; respectivamente 
as retas que passam pela origem em Rº e contêm u e v. Mostre que 
Rê=H 65. 

2.7. Sejam F, = S(uy,v1) e F; = S(uz,v>) os subespaços de Rº gerados 
pelos vetores w = (0,1,-2), vw = (1,1,1), wu = (-1,0,3) ev = 
(2,—1,0). Ache números ay, bj, cy e az, bz, cz tais que se tenha: 





H=(igyzcR;ax+biy+cz=o0 
> 9x + bay + coz = 0). 











ddr) 


Fa =((R,U,Z) É 


2.8. No exercício anterior, mostre que u £ F e que FH +F = Rº. 
Exiba um vetor não nulo w € F; N F; e conclua que não se tem Rº — 
Hek. 
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2.9. Prove que S(X) é a interseção de todos os subespaços vetoriais 
que contêm o conjunto X C E. 


2.10. Exiba três vetores u, v,w € Rº com as seguintes propriedades: 
nenhum deles é múltiplo do outro, nenhuma das coordenadas é igual 
a zero e Rº não é gerado por eles. 


2.11. Seja F o subespaço de Rº gerado pelos vetores u = (1,1,1) e 
v = (1,—1,-—1). Ache números a, b, c com a seguinte propriedade: 
um vetor w = (x,y,Z) pertence a F se, e somente se, ax + by +cz = 0. 


2.12. Exprima o vetor (1, —3,10) como combinação linear dos vetores 
u=(1,00),v=(Ll0)ew= 2,-3,5). 


4 


2.13. Mostre que a matriz d = [ 6 


—4 
16 pode ser escrita como 


combinação linear das matrizes 
O sfi = 
SS apt Sa 4) * Ea dl 
2.14. Assinale V(erdadeiro) ou F(also): 


( ) O vetor w = (1,—1,2) pertence ao subespaço gerado por u = 
(1,2,3) ev=(3,2,1). 


( ) Qualquer vetor em Rº pode ser expresso como combinação li- 
near dos vetores u = (-5,3,2)ev = (3,—1,3). 


( )SeXcYentão S(X) csS(Y). 
( ) SeS(X) cS(Y) então X cY. 
( ) Se uma variedade afim V c E contém o vetor zero então V é 


um subespaço vetorial de E. 


2.15. Quais dos seguintes subconjuntos são subespaços vetoriais? 





(a) O conjunto X € Rº formado pelos vetores v — (x,1,Z) tais que 
Z= Ie x. 











(b) O conjunto Y c Rº formado pelos vetores v = (x,y,z) tais que 
xy =0. 
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(c) O conjunto Z das matrizes 2 x 3 nas quais alguma coluna é 
formada por elementos iguais. 


(d) O conjunto F c F(R;R) formado pelas funções f:R > R tais 
que f(x+ 1) = f(x) paratodox E R. 


(e) O conjunto L c R” dos vetores v = (x,2x,...;nx), onde x E R é 
arbitrário. 


(f) O conjunto dos vetores v E Rº que têm duas ou mais coordena- 
das nulas. 


(g) O conjunto dos vetores de Rº que têm pelo menos uma coorde- 
nada > 0. 


2.16. Exprima, em termos das operações num espaço vetorial E, uma 
condição para que u,v,w € E sejam colineares (isto é, pertençam a 
uma mesma reta, que pode conter ou não o vetor zero). 


2.17. Obtenha números a, b, c, d tais que a variedade afim (plano) 
de Rº definida pela equação ax + by + cz = d contenha os pontos 
€1 = (1,0,0), €2 = (0,1,0) e es = (0,0,1). 


2.18. Prove que, na definição de subespaço vetorial, a condição 
“O e P” pode ser substituída por “F < 9”. 


2.19. Quais dos seguintes conjuntos são subespaços vetoriais? 

(a) O conjunto dos vetores de R” cujas coordenadas formam uma 
progressão aritmética. 

(b) Os vetores de R” cujas coordenadas formam uma progressão ge- 
ométrica. 
(c) Os vetores de R” cujas coordenadas formam uma progressão ari- 
tmética de razão fixada. 

(d) Os vetores de R” cujas coordenadas formam uma progressão ge- 
ométrica de razão fixada. 

(e) Os vetores de R” cujas primeiras k coordenadas são iguais. 

(f) Os vetores de R” que têm k coordenadas iguais. 

(g) As segiiências (xn) E RO tais que xn42 — 3Xn = Xn41 para todo n. 
(h) Os vetores (x,y) E R? tais que x? +3x— y? +3u. 

(1) As funções f E CV(R) tais que f” —2f' +1=0. 
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2.20. Sejam vi, vz, V3 Os vetores-linha e wy, W2, W3 Os vetores-coluna 


da matriz 
3 


2 
45 6 
7 8 9 

Verifique as relações v3 = 2v2 — V1, W3 = 2w2 — wj. Exprima w e 
w2 como combinações lineares de v; e vz, e vice-versa. Conclua que 
os vetores-linha e os vetores-coluna da matriz dada geram o mesmo 
subespaço de Rº. 





2.21. Dê exemplo de uma matriz 3 x 3 cujos vetores-linha geram um 
subespaço de Rº diferente daquele gerado pelos vetores-coluna. 











2.22. Prove que a reunião de dois subespaços vetoriais de E é um 
subespaço vetorial se, e somente se, um deles estiver contido no ou- 
tro. 


2.23. A partir da definição, prove que, dados os números aj, ..., An,C, 
o conjunto V dos vetores x = (x1,...,Xn) € Rº tais que ax, + --- + 
AnXn = c é um subespaço vetorial de R” se, e somente se, c = 0. 
Prove a afirmação feita no texto de que V é uma variedade afim. 


2.24. Seja F um subespaço vetorial de E. Assinale V(erdadeiro) ou 
F(also): 


() SeugF e vgF então u+vée F; 
() SeugF e «0 então ou é F. 


2.25. Diz-se que um subconjunto X de um espaço vetorial E é simé- 
trico quando v € X > —v E X. Prove que um cone convexo simétrico 
e não-vazio é um subespaço vetorial de E. 


2.26. Dê exemplo de um cone convexo que não seja simétrico e um 
cone simétrico que não seja convexo. 


2.27. Uma matriz quadrada a = [a;] chama-se simétrica (respect. 
anti-simétrica) quando a; — a; (respect. a; — —a;;) para todo i e 
todo j. Prove que o conjunto S das matrizes simétricas e o conjunto 
A das matrizes anti-simétricas n x n são subespaços vetoriais de 
Mí(n xn)equesetem M(nxn)=SGA. 


2.28. Seja E = F(R;R). Fixada g:R > R, mostre que o conjunto F 
de todas as funções f: R > R tais que f(g(x)) = f(x) é um subespaço 
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vetorial de E. Para qual função g tem-se F = conjunto das funções 
periódicas de período a? E se fosse g(f(x)) = f(x)? Ou f(g(x)) = 
g(x)? 


2.29. Prove que o subespaço vetorial gerado por um cone convexo 
Cc E éo conjunto das diferenças u — v, onde u,v € C. Conclua que 
o conjunto das funções f: X > R que só assumem valores positivos é 
um conjunto de geradores de F(X;R). 


2.30. Diz-se que uma função f: X > R é limitada quando existe 
k > 0 (dependendo de f) tal que |f(x)| < k para todo x E X. Prove que 
o conjunto das funções limitadas é um subespaço vetorial de F(X;R), 
o qual é gerado pelas funções limitadas positivas. 


2.31. Um subespaço vetorial de Rº gerado por dois vetores não-coli- 
neares u, v chama-se um plano. Use um argumento geométrico para 
provar que se o vetor w € Rº não pertence ao plano gerado por u e v 
então u, v e w geram Rº. 


2.32. Mostre que o vetor b = (1,2,2) não é combinação linear dos 
vetores vi = (1,1,2) e vz = (1,2,1). A partir daí, formule um sistema 
linear de 3 equações com 2 incógnitas, que não possui solução e que 
tem o vetor b como segundo membro. 

2.33. Sejam F;,...,Fx C E subespaços vetoriais. Prove: 

(1) O subespaço gerado pela união FU...UF, é o conjunto H+---+F 
das somas x; + ---+ xy, onde x; E H,...,xk € Fe. 

(2) As seguintes afirmações são equivalentes: 


(a) Cada x e H +.--: + F, se escreve de modo único como soma 
x=m ++ 


(b) Para cada j = 1,...,k tem-se EN(F+- + +++) = 
105. 


Quando uma das condições (a) ou (b) vale, escreve-se  &---&F, em 
vez de F +--:- + F, e diz-se que este subespaço é a soma direta de 
Eljacas ks 


2.34. SjaE = HO F =G/0G,. Sef Cc GyefFf; € Gs, prove que 
K =6G1 ef = Gs. 
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2.35. Sejam E, F espaços vetoriais. Uma função f: E > F chama-se 
par (respect. ímpar) quando f(—v) = f(v) (respect. f(—v) = —f(v)) 
para todo v € E. Prove: 


(a) O conjunto A das funções pares e o conjunto B das funções ímpa- 
res são subespaços vetoriais de F(E;F) (vide Exerc. 1.15) e vale 
F(EF-AgB. 


(b) Além dos conjuntos A, dos polinômios pares, e B, dos polinômios 
ímpares, considere também o conjunto A' dos polinômios da forma 
p(x) = La;x? que só contêm expoentes pares e o conjunto B' dos po- 
linômios da forma q(x)-La;x?'*!, que só contêm expoentes ímpares. 
Prove que A' e B' são subespaços vetoriais do espaço P de todos os 
polinômios, que A/C A,B'cBe?P=A'g&B”. Conclua que À = A' e 
B-B'. 

2.36. Para todo n E N seja Q, o conjunto dos polinômios (de graus 
arbitrários) que são divisíveis por x”. Prove que Q, é um subespaço 
vetorial de P. Ache um subespaço Fc Ptal que P = FO Qhn. 

2.37. Dado X C E, seja Y o conjunto obtido de X substituindo um 
dos seus elementos v por v+ ou, ondeu E Xe « E R. Prove que 
X e Y geram o mesmo subespaço vetorial de E. Conclua daí que os 
conjuntos [v1,...,vk) C E elvi,v2—VI,...,Vk—VI) C E geram o mesmo 
subespaço vetorial de E. 


2.38. Prove que a reunião de três subespaços vetoriais só pode ser 
um subespaço vetorial quando um deles contém os outros dois. 


2.39. Sejam H, F> subespaços vetoriais de E. Se existir algum a € E 
tal que a+F c F, prove que F; E F5. 


2.40. Seja V c E uma variedade afim. Dados vi,...,vm E Ve 
«1,...s&4m E R com q +---+am = 1, prove que ayvi+---+amvm E V. 


2.41. Para todo subespaço vetorial F c R”, prove que existe um 
subespaço G CR" tal queR? -=F&o 6. 


2.42. Verdadeiro ou falso? Para quaisquer subconjuntos X,Y c E 
tem-se 


S(XUY) = S(X) + S(Y), 
HAM = SANS 


— 
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(A última das igualdades acima sugere uma pergunta: qual seria 
o subespaço vetorial gerado pelo conjunto vazio? À convenção mais 
conveniente é S(()) = (0).) 


2.43. Dado o subconjunto não-vazio X do espaço vetorial E, a va- 
riedade afim gerada por X é, por definição, o conjunto V(X) de to- 
das as combinações lineares «yvi + --- + &GnVn, COM VI,...,Vn E XE 
ay +---+ an = 1. Prove que 


(a) V(X) é uma variedade afim; 


(b) Fixado qualquer vo € X, tem-se V(X) = vo + F, onde Fé o 
subespaço vetorial de E gerado pelos vetores v — vo, onde v E X. 


3 


Bases 


Os espaços vetoriais de dimensão finita, objetos centrais do nosso 
estudo, possuem uma estrutura algébrica extremamente simples, evi- 
denciada pelas idéias de base e dimensão, que apresentaremos agora. 
Uma vez fixada uma base num espaço vetorial de dimensão n, seus 
elementos são meramente combinações lineares dos n vetores básicos, 
com coeficientes univocamente determinados. Nesta seção, esses fatos 
serão estabelecidos e analisados em detalhe. 


Seja E um espaço vetorial. Diz-se que um conjunto X C E é line- 
armente independente (abreviadamente, L.I.) quando nenhum vetor 
v € X é combinação linear de outros elementos de X. Para evitar 
ambiguidade, no caso em que X = ([v) consta de um único elemento 
v, diz-se que X é L.I., por definição, quando v 4 0. Quando X é L.I., 
diz-se também que os elementos de X são vetores linearmente inde- 
pendentes. 

Quando o conjunto X é L.I. seus elementos são todos < 0, pois o 
vetor nulo é combinação linear de quaisquer outros: O = 0-v/ +---+ 
O - vm. (Se não há “outros”, X = (v), v 0.) 

Um critério extremamente útil para verificar a independência 
linear de um conjunto é dado pelo teorema abaixo. 


Teorema 3.1. Seja X um conjunto L.I. no espaço vetorial E. Se 
Qyvi +: + &mVm=0 com vi,...,)vm E X então «| = --- = «m—0. Re- 
ciprocamente, se a única combinação linear nula de vetores de X é 
aquela cujos coeficientes são todos iguais a zero, então X é um con- 
Junto LI. 
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Demonstração: Suponhamos, por absurdo, que se tenha «yvi+-- + 
Am VYm = O com vy,...,vm € X mas nem todos os «; sejam nulos. Por 
simplicidade, seja «, * O. Então teremos v; = —(w2/a1)vz — --- — 
(am/21)vm = 0, 0 que exprime v; como combinação linear de outros 
elementos de X. Reciprocamente, se X não fosse L.I., algum dos seus 
vetores seria combinação linear dos demais: 


v=mqvi+-:+tamym logo T-v—av—--— &myvm = 0, 


uma combinação linear nula de vetores em X, na qual pelo menos o 
primeiro coeficiente não é zero. 














Corolário. Se v = «jvi +:--+Ôamvm = Bivi +: + Bmvm e Os vetores 
vV1,-..,Vm são L.l. então «4 = B1,...,Gm = Bm. 

Com efeito, tem-se neste caso (x; — Bi)vi + ---+ (am — Bm)vm = O 
logo oa; —Bj=---=àam— Bm =0. 














Evidentemente, todo subconjunto de um conjunto LI. é 
ainda L.I.. 


Exemplo 3.1. Os vetores canônicos e; = (1,0,...,0),...,en = 
(0,...,0,1) em R” são L.I.. Com efeito, qe; +--- + mnen = 0 
significa (01,...,0n) = 0, logo « = --- = «n = 0. Analogamente, 
os monômios 1,x,...,x” em P, são L.I. pois « + ex +---+anx” = 
p(x) é o vetor nulo em P, somente quando p(x) é a função identi- 
camente nula, isto é, p(x) = O para todo x E R. Isto obriga a ser 





&o =: = à = O pois um polinômio não nulo de grau k tem no 
máximo k raízes reais. Esta observação nos permite ainda concluir 
que X=(1,x,...,x”,...,c P é um conjunto infinito LI.. 


Na prática, o critério seguinte é às vezes útil. 


Teorema 3.2. Sejam v;,...,vm Vetores não-nulos do espaço veto- 
rial E. Se nenhum deles é combinação linear dos anteriores então o 
conjunto X = (vi,...,vVm) é LI.. 


Demonstração: Suponhamos, por absurdo, que uma combinação li- 
near dos vetores dados, com coeficientes não todos nulos, fosse igual 
a zero. Se «v, fosse a última parcela não-nula dessa combinação, 
teríamos então 


eqvi ++ =0, 
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= 





com q + O. Daí viria v;, = —& |V] v,-1, logo v; seria 
combinação linear dos elementos anteriores a ele na lista vj,...,Vm- 
(Observe que r > 1 poisv; £Z0.) 














Observação: Evidentemente, vale um resultado análogo, com “sub- 
sequentes” em vez de “anteriores” no enunciado. 


Um conjunto X c E diz-se linearmente dependente (abreviada- 
mente, L.D.) quando não é L.I.. 


Isto significa que algum dos vetores v € X é combinação linear 
de outros elementos de X, ou então que X = (0). A fim de que X seja 
L.D. é necessário e suficiente que exista uma combinação linear nula 
Qqvi + --+ &mVm = O de vetores vi,...,Vm € X com algum coeficiente 
q 0. SeXc YeXé L.D. então Y também é L.D.. Se0 e X então o 
conjunto X é L.D.. 


Exemplo 3.2. Os vetores u = (1,2,3), v = (4,5,6), w = (7,8,9) em 
Rº são L.D. poisw = 2v—u 


Exemplo 3.3. Quando os vetores vi,...,Vm são L.D., isto não signi- 
fica que qualquer um deles seja combinação linear dos demais. Por 
exemplo seu = (1,2), v=(3,4)ew = (4,8) então (u,v,w) C R? é um 
conjunto L.D. pois w = 4u +0-v porém v não é combinação linear de 
uew. 

Uma base de um espaço vetorial E é um conjunto 5 c E linear- 
mente independente que gera E. Isto significa que todo vetor v E E 
se exprime, de modo único, como combinação linear v = qyvy + ---+ 
&mVm de elementos vi,..., vm da base 6. Se B = [vi,...,Vm) é uma 
base de E ev = avi + --: + amvm, então os números «1,...,&m 
chamam-se as coordenadas do vetor v na base B. 


Exemplo 3.4. Os vetores e; = (1,0,...,0),...,en = (0,...,0,1) cons- 
tituem uma base (e;,..., en; de R”, chamada a base canônica. Ana- 
logamente, os monômios 1,x,...,x” formam uma base para o espaço 
vetorial P, dos polinômios de grau <n. O conjunto 


RO e AGR 


dos monômios de graus arbitrários constitui uma base (infinita) para 
o espaço vetorial P de todos os polinômios reais. Convém obser- 
var, entretanto, que o conjunto X = (e1,...,6n,...) €C Rº, onde 
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en = (0,...,0,1,0,...) é a sequência infinita cujo n-ésimo termo é 
1 e os demais são iguais a zero, é um conjunto infinito L.I. mas 
não é uma base de Rº pois não gera este espaço. Com efeito, o 
subespaço vetorial de Rº gerado por X é o conjunto R!ºº) formado 
pelas segiiências v = (&7,...,&n,...) nas quais apenas um número 
finito de coordenadas x é £ 0. 

Demonstraremos a seguir que se um espaço vetorial E admite 
uma base com n elementos então todas as bases de E têm o mesmo 
número n de elementos. Este número é chamado a dimensão de E. 

O ponto de partida é o lema abaixo. Nele, um sistema linear é 
chamado homogêneo quando o segundo membro de cada equação é 
igual a zero. Todo sistema homogêneo admite pelo menos a solução 
trivial (0,0,...,0). Isto é coerente com o Exemplo 2.4, pois as so- 
luções v = (x1,...,Xn) de um sistema homogêneo constituem um 
subespaço vetorial de R” e todo subespaço contém o vetor nulo. 


Lema 3.1. Todo sistema linear homogêneo cujo número de incógni- 
tas é maior do que o número de equações admite uma solução não- 
trivial. 


Demonstração: Consideremos o sistema 





nX + dp + es 











azixi + ax +++ am =0 
(+) 
AmiX1 + AmzX2 + *-- + AmmXn = 0, 


de m equações com n incógnitas, onde m <n. Usaremos indução no 
número m de equações. Para m = 1, temos uma única equação 


aux + +anm=o, 


com n > 1 incógnitas. Um dos coeficientes aj; é % O. Mudando os 
nomes das incógnitas, se necessário, podemos supor que an £ 0. À 
equação dada equivale a 





al | Un 
Xn = X Tea Xn-1 ). 
aim am 
Atribuindo arbitrariamente valores não-nulos às n — 1 incógnitas 
X1,::.,Xn-1 € calculando x, por meio desta última expressão, obte- 


mos uma solução não-trivial (x1,...,Xn) para a equação dada. Para 
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completar a indução, suponhamos o lema verdadeiro para um sis- 
tema com m — 1 equações. Mudando, se necessário, a ordem das 
equações e os nomes das incógnitas, podemos admitir que, no sis- 
tema (*) dado, tem-se amn % O. Então da m-ésima equação resulta 


Ami Amn-1 
Xn ( XxX ++ Xn-1 |). 


Am Am 





Substituindo, em cada uma das m— 1 primeiras equações, a incógni- 
ta xn por este valor, obtemos um sistema homogêneo de m — 1 equa- 
ções nas n — 1 incógnitas x1,...,Xn-1. Pela hipótese de indução, este 
sistema admite uma solução não-trivial (01,...,ân-1), poisn— 1 > 
m—1. Pondo 





Ami Amn-l 
En = Oq ue = Qn-1 |) 


Am Am 


obtemos uma solução não-trivial (x1,...,&n-1, &n) do sistema pro- 
posto (*). 














Teorema 3.3. Se os vetores vj,...,Vm geram o espaço vetorial E 
então qualquer conjunto com mais de m vetores em E é L.D. 


Demonstração: Dados os vetores w,...,wn em E, comn > m, 
para cada j = 1,...,;n temos w; = «1jvi + --: + KmjVm pois os vetores 
v1,---, Vm geram E. Para mostrar que os vetores w; são L.D., deve- 
mos achar coeficientes x1,...,Xn, não todos iguais a zero, tais que 
xiwm1 +: +Xnwn = 0. Substituindo os w; por suas expressões em 
termos dos v;, esta igualdade significa que 


n n n 
> om vi + > do bo do aa DO vm =—0. 
j=1 j=1 j=1 


Certamente esta última condição será satisfeita desde que todos os 
somatórios dentro dos parênteses sejam nulos, ou seja, que 


(x1,...,Xn) seja uma solução não-trivial do sistema homogêneo 
&nx + ax ++ am =0 
A21X1 + &22X2 ++: + OonXm = 0 








AmiX1 + &m2X2 + --- + &mnXn = O. 
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Uma tal solução existe, pelo Lema 3.1, pois n > m. Logo wj,...,Wn 
são L.D. e o teorema está demonstrado. 














Corolário 1. Se os vetores v1,...,Vm geram o espaço vetorial E e os 
vetores u,..., Um são L.I.entãon <m. 


Este corolário é uma mera reformulação do Teorema 3.8. 


Corolário 2. Se o espaço vetorial E admite uma base B=(uy,...,Un) 
com n elementos, qualquer outra base de E possui também n elemen- 
tos. 


Com efeito, seja B' = (vj,...,vm+ outra base de E. Como B' gera E 
e B é L.I., temosn < m, pelo Corolário 1. Como B gera Ee B' é LI. 
do mesmo corolário segue-se m <n. Logo m =n. 














Diz-se que o espaço vetorial E tem dimensão finita quando ad- 
mite uma base 5 = [v;,...,vn) com um número finito n de elemen- 
tos. Este número, que é o mesmo para todas as bases de E, chama-se 
a dimensão do espaço vetorial E: n = dim E. Por extensão, diz-se 
que o espaço vetorial E = (0) tem dimensão zero. 


Corolário 3. Se a dimensão de E é n, um conjunto com n vetores 
gera E se, e somente se, é L.I.. 


Com efeito, se X = (vy,...,Vn) gera E e não é L.l. então um dos 
seus elementos é combinação dos n — 1 restantes. Estes n — 1 veto- 
res formariam ainda um conjunto de geradores de E, em contradição 
com o Teorema 3.3, pois E contém (uma base com) n vetores line- 
armente independentes. Reciprocamente, suponhamos que X seja 
L.I.. Se X não gerasse E, existiria um vetor v € E que não seria 
combinação linear dos elementos de X. Então, pelo Teorema 3.2, 
(vi, ..., Vn, V] seria L.I., em contradição com o Teorema 3.8, pois uma 
base de E, com n elementos, gera o espaço. 














Como a base canônica (e;,..., en) CR” temn elementos, R” é um 
espaço vetorial de dimensão finita n. Segue-se então do Corolário 3 
que, para mostrarmos que n vetores vj,...,vn € R” formam uma 
base basta provarmos que eles são L.l. ou, alternativamente, que 
geram R”. 
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Teorema 3.4. Seja E um espaço vetorial de dimensão finita n. Então: 


(a) Todo conjunto X de geradores de E contém uma base. 
(b) Todo conjunto L.l. (vi,...,vm) E E está contido numa base. 


(c) Todo subespaço vetorial F c E tem dimensão finita, a qual é 
<n. 


(d) Se a dimensão do subespaço F C E é igual a n, então F = E. 


Demonstração: (a) Os conjuntos L.l. em E têm no máximo n 
elementos. Seja Y = (vy,..,Vm) C X um subconjunto L.l. de X 
com o número máximo possível de elementos. Se existisse algum 
vetor v € X que não fosse combinação linear de vj,...,vm então o 
conjunto (v1,...,Vm,Vi C X seria L.I. pelo Teorema 3.2, mas isto con- 
tradiria a maximalidade de m. Logo devemos ter X c S(Y), donde 
E =S(X) c S(Y) e daí S(Y) = E, ou seja Y é uma base de E, contida 
em X, como se devia demonstrar. 


(b) Seja 


FT = Mess Vini Uma la es Vi) 


um conjunto L.I. com o número máximo possível de elementos con- 
tendo os m vetores dados. (Pelo Teorema 3.3, tem-se k < n.) Se 
existisse em E algum vetor v que não fosse combinação linear dos 
elementos de Y, então YU (v) seria um conjunto L.I., de acordo com 
o Teorema 3.2, em contradição com a maximalidade de k. Segue-se 
que Y gera E, logo é uma base de E, contendo vj,...,Vm. 


(c) Seja Y = (vy,...,vm) C F um subconjunto de F que é L.l. e tem 
o número máximo possível de elementos. Então Y gera F pois se 
algum elemento v E F não fosse combinação linear dos vetores de Y 
então, pelo Teorema 3.2, [v3,...;vm,V) EC F seria um conjunto L.I., 
contrariando a maximalidade de m. Portanto Y é uma base de F 
e F tem dimensão finita. Além disso, tem-se dm F= m < n pois 
nenhum conjunto com mais de n elementos em E pode ser LI.. 

(d) Se dim F = dim E = n então toda base de F é um subconjunto 
L.I. com n elementos em E, logo gera E, pelo Corolário 3. Segue-se 
que F=E. 
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Neste livro, trataremos primordialmente dos espaços vetoriais 
de dimensão finita. Diz-se que o espaço vetorial E tem dimensão 
infinita quando ele não tem dimensão finita, isto é, quando nenhum 
subconjunto finito de E é uma base. Como todo subconjunto finito 
(que não se reduza ao vetor 0) contém um subconjunto L.I. que gera 
o mesmo subespaço, podemos dizer que um espaço vetorial E tem 
dimensão infinita se, e somente se, não é gerado por um conjunto 
finito de vetores. Por exemplo, o espaço P de todos os polinômios 
reais tem dimensão infinita pois se X c P é um conjunto finito de 
polinômios e r é o mais alto grau de um polinômio qualquer de X 
então o subespaço vetorial gerado por X está contido em ?P;,, logo não 
é igual a P. 


Exemplo 3.5. Os monômios 1,x,...,x” constituem uma base do 
espaço vetorial Ph, dos polinômios de grau < n, logo Ph, tem di- 
mensão finita e dm P, = n + 1. Por outro lado, o conjunto infi- 
nito (1,x,..., x?,...; é uma base do espaço vetorial P de todos os 
polinômios, o qual tem dimensão infinita. Também tem dimensão in- 
finita o espaço R!ºº), introduzido no Exemplo 3.4, pois admite a base 
infinita (2,,€2,..., en,...), onde & = (0,...,0,1,0,...) é a sequência 
infinita cujo n-ésimo termo é 1 e os demais são zeros. Finalmente, 
embora não exibamos explicitamente uma base para o espaço Rº, 
podemos assegurar que ele não tem dimensão finita, em virtude do 
item (c) do Teorema 3.4 acima, já que R!º) é um subespaço de Rº 
com dimensão infinita. 


Exemplo 3.6. O espaço vetorial M(m x n), das matrizes m xn, tem 
dimensão finita, igual a m-n. Uma base para M(m x n) é formada 
pelas matrizes e;;, cujo ij-ésimo elemento (na interseção da i-ésima 
linha com a j-ésima coluna) é igual a 1 e os demais elementos são 
iguais a zero. 


Exemplo 3.7. Se os coeficientes a;,...,an não são todos iguais a 
zero, o hiperplano 
H=((x,..,xn) ECRM ax ++ ax O 
é um subespaço vetorial de dimensão n — 1 em R”. Com efeito, ad- 
mitindo (por simplicidade) que an £ 0, vemos que 
a An] 


v=(x,..,xm)€CHS x = Xx— e Xnoi 
n An 
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Em particular, para todoi = 1,...,n— 1,0 vetor 
Vi (0,...51,...,0,—0;/0n), 


cuja i-ésima coordenada é 1, a última é —a;/a, e as demais são zero, 
pertence a H. Além disso, os vetores vj,...,vn-| são L.l., como se 
vê facilmente. Logo o subespaço H tem dimensão n — 1 ou n. Como 
H Z R? (por exemplo, o vetor v = (0,...,0,an) não pertence a H), 
segue-se que dm H = n — 1 e os vetores vy,...,Vn-1 formam uma 
base do hiperplano H. 

Diz-se que a variedade afim V c E tem dimensão r quando V = 
x + F, onde o subespaço vetorial F c E tem dimensão r. 


Exercícios 
3.1. Dados os vetores u = (aj,,02,03), v = (by,b2,b3) e 
w = (cy,c2,c3), escreva u = (a1,02), V — (by,bz) e w' = (cy,c2). 


Supondo u' ev' L.I., existem «,B € Rtais que w' = au' + pv”. Prove 
que (u,v, w) é L.D. se, e somente se, w = au + Bv (com os mesmos « 
e B). Use esse critério para determinar se os vetores u, v e w abaixo 
são L.I. ou L.D.: 


(a) = [1,25], v= [1,52], W 


(=1,2,3) 
(b) u=(1,2,3), v=(1,32), w=(1,4,1). 


3.2. Mostre que as matrizes a, b e c abaixo são L.I.: 


=p) e] 


3.3. Prove que os polinômios seguintes são linearmente independen- 
tes: 


po)=x-5x2+1, qixy)=2X+5x—6, ri)=x2-5x+2. 


3.4. Seja X um conjunto de polinômios. Se dois polinômios quaisquer 
pertencentes a X têm graus diferentes, prove que X é LI.. 
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3.5. No espaço P3 dos polinômios de grau < 3, verifique se os po- 
linômios abaixo são L.I. ou L.D.: 


po)=x 3x +5x+1, 
q(x) = -x+6x+2, 
ri)=x— 7x + 4x. 


3.6. Se uma função em C“(R) é combinação linear de outras então 
suas derivadas sucessivas são combinações lineares (com os mes- 
mos coeficientes) das derivadas dessas outras. Use este fato para 
mostrar que (e*, e?*,x?,x?,x) é um conjunto L.I.. 


3.7. Seja E = KH GH. Se B; é uma base de F; e 6; é uma base de E, 
prove que B; U 6; é uma base de E. 


3.8. Exiba uma base para cada um dos subespaços de Rº listados a 
seguir: 


F=[(x1,x2,X3,%4);x1 =X2 =X3 = x4) 

G = [(x1,x2,X3,%4);x1 = X2 6 X3 = X4) 
H=((x,x2,X3,X4);x1 = X2 = x3) 

K = ((x1,x2,X3,X4);Xx1 + x2 + x3 + x4 = 05. 


3.9. Seja E um espaço vetorial de dimensão finita. Dado um subespa- 
ço Fc E, prove que se pode obter um subespaço G c E tal que 
E-=Fo6. 


3.10. Seja F o subespaço vetorial (plano) de Rº formado pelos vetores 
v= (x,y,z) tais que x — 2y +4z = 0. Obtenha uma base (um, u2, 3) E 
Rê tal que u e 2 pertençam a F. 


3.11. Mostre que os polinômios 1,x— 1 ex? —3x+41 formam uma base 
de P;. Exprima o polinômio 2x? — 5x + 6 como combinação linear dos 
elementos dessa base. 


3.12. Mostre que os vetores u = (1,1) ev = (—1,1) formam uma 
base de R?. Exprima cada um dos vetores e, = (1,0) e e = (0,1) 
como combinação linear dos elementos dessa base. 
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3.13. Mostre que os vetoresu = (1,1,1),v= (1,2) ew = (2,1,2) 
são L.D.. 


3.14. Assinale V(erdadeiro) ou F(also) quanto à validez da afirmação: 
“A união de dois subconjuntos L.I. do espaço vetorial E é ainda 

um conjunto L.1.” 

) Sempre. 

) Nunca. 

) Quando um deles é disjunto do outro. 

) Quando um deles é parte do outro. 

) Quando um deles é disjunto do subespaço gerado pelo outro. 


( 
( 
( 
( 
( 
( 


) Quando o número de elementos de um deles mais o número de 
elementos do outro é igual à dimensão de E. 


3.15. Seja S o conjunto das matrizes simétricas n x n. Para cada 
par (i,j) de números naturais de 1 atén, com i < j, seja s; a matriz 
n x mn cujos elementos nas posições ij e ji são iguais a 1 e os de- 
mais são zero. Prove que estas matrizes constituem uma base para 
o subespaço vetorial S c M(n x n1). De modo análogo, obtenha uma 
base do subespaço A das matrizes anti-simétricas n x n. Conclua 
que dm S=n(n+1)/2e dim A =n(n — 1)/2. 


3.16. As matrizes t — [t;] € M(n x n) tais que t; = O quando i < j 
são chamadas triangulares inferiores. Prove que elas constituem 
um subespaço vetorial L Cc M(n x n), obtenha uma base para L e 
determine a sua dimensão. 


3.17. Obtenha uma base e consegientemente determine a dimensão 
de cada um dos subespaços de M(n x n) abaixo descritos: 


(a) matrizes cuja soma dos elementos da diagonal (traço) é zero. 
(b) matrizes que têm a primeira e a última linha iguais. 
(c) matrizes cuja segunda linha é igual à terceira coluna. 


(d) matrizes nas quais a soma dos elementos da primeira linha é 
igual à soma dos elementos da segunda coluna. 
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3.18. Sejam u,v € E vetores linearmente independentes. Dado «a < 
0, prove que o conjunto de dois elementos (v, v + «u) é uma base do 
subespaço gerado pelos vetores v,v+u,v+2u,...,v+nU,.... 


3.19. Sejam v; = (1,2,..5,n), v = (n+Hin+2..5,2N),..sVn = 
(n?-n+1,n?-n+4+2,...,n?). Prove que estes vetores geram em R” 0 
mesmo subespaço F que os vetores w = (1,n+1,2n+1,...,n?—n+1), 
w2 = (2,n+42,..,n2-n+42),..,Wn = (n,2n,...,n2?) e que dim F= 2. 
(Veja Exercício 2.3.) 


3.20. Ache uma solução não-trivial para o sistema homogêneo: 





XX + 2x + 3x + 44 = 0 
2x + x + x — x =0 
3x — 2x + x — 2x = 0 


e, a partir daí, obtenha uma combinação linear nula dos vetores vi = 
(152,3), V2 = pr | 4 V3 = Los LE 1 h V4 = (4, e Pao À na qual os 
coeficientes não são todos iguais a zero. 


3.21. Seja (vi,..., vn) uma base do espaço vetorial E. Se os números 
q1,..., On não são todos iguais a zero, prove que o conjunto F dos 
vetores v = x1V1 + --: + Xnvn tais que ax; + --- + ax = O é um 
subespaço vetorial de E, com dim F=n — 1. 


3.22. Prove que [1,e*,e”*,e*x,e**) é um conjunto L.I. no espaço 
C(R). (Sugestão: dada uma combinação linear nula, derive-a, de- 
pois divida por e* e prossiga.) 


3.23. Sejam Xy,..., Xn,... subconjuntos L.I. do espaço vetorial E. 


(a)SeX CX C...CXn CX CE... prove queX=|[]X éLI. 








(b) Se cada X, tem n elementos, prove que existe um conjunto line- 
armente independente X* = (x1,...,Xn,...; com x, E Xn para cada 
nen. 


(c) Supondo E = R(ºº) e admitindo as hipóteses dos ítens anteriores, 
é verdade que X = [ Xn seja uma base de E? 


3.24. Se os vetores v1,..., vm são L.l., prove que o mesmo se dá com 
os vetores vi,v2 — V1,...,Vm — VI. Vale a recíproca? 
3.25. Dado o conjunto finito X = (a,,..., an), obtenha uma base para 


o espaço vetorial F(X;R). 
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3.26. Seja X um conjunto infinito. Para cada a E X, seja fa: X > R 
a função tal que fala) = 1 e fal(x) = 0 sex £ a. Prove que o conjunto 
Y c F(X;R) formado por estas funções é linearmente independente, 
logo F(X;R) não tem dimensão finita. Prove ainda que Y não gera 
F(X;R). 


3.27. Sejam F,, F; C E subespaços de dimensão finita. Obtenha uma 
base do subespaço F; + F> que contenha uma base de F;, uma base de 
É e uma base de F N F,. 


3.28. Exiba uma base para cada um dos espaços vetoriais abaixo e 
daí calcule sua dimensão: 


(a) polinômios pares de grau <n. 
(b) polinômios ímpares de grau <n. 
(c) polinômios de grau <n que se anulam parax = 2ex=3. 


(d) vetores de R” (m > 6) nos quais a segunda, a quarta e a sexta 
coordenadas são iguais. 


3.29. Pode-se ter uma base de P, formada por n + 1 polinômios de 
grau n? 


3.30. Mostre que os vetores u = (1,1,1),v = (1,2,3) ew = (1,4,9) 
formam uma base de Rº. Exprima cada um dos vetores ey, e», e; da 
base canônica de Rº como combinação linear de u, v e w. 


3.31. Ache uma segiência infinita F,,F,,...,Fn,... de subespaços 
vetoriais de P tais que: (a) dim F, = 00; (b) FnN Fr, = (0) sem Zn. 


3.392. Para] <i<mel<j<n,seamsyt;: M(mxn) >R as 
funções definidas por si(a) = soma dos elementos da i-ésima linha 
de a et;(a) — soma dos elementos da j-ésima coluna de a. Prove que 
s1,...,Sm, t1,..., tn São L.D. no espaço vetorial E = F(M(m x n);R) 
mas o conjunto (sj,...,Sm-1nt1,.. tn) é LI. 


3.33. Com as notações do exercício anterior, sejam 1,0: M(n x n) > 
R as funções definidas, para cada a = la;] e M(n xn) por T(a) = 
q + --- + am (soma dos termos da diagonal principal) e o(a) 
ain + G2n-1 + -:: + ani (soma dos termos da outra diagonal). Prove 
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que, paran > 3, (sy,...,Sn-1,t1,..., tn, T, 0) são funções linearmente 
independentes. 

3.34. Num espaço vetorial E, diz-se que o vetor v é uma combinação 
afim dos vetores v;,...,vr quando se tem v = vi +: + mv, 
com «q + --- + « = 1. Diz-se que os vetores v,...,v, são afim- 


independentes quando nenhum deles é uma combinação afim dos 

demais. Prove que as seguintes afirmações são equivalentes: 

(1) Os vetores v1,...,vr são afim-independentes. 

(MSecwvi+---+av=0eowa+---+a=0Oentãoa =---=0«=0. 

T TE 

(3) Se owvi+H---+oev =PByvi+---+PBrv; com > q => B;então 
i= i=1 

«1 = B1,...,0y = Br. (Em particular, duas combinações afins dos vi; 

só podem ser iguais quando tiverem os mesmos coeficientes.) 


(4) Os vetores vz — vi,V3 — V1,...,Vr — VI são LI.. 
(5) A variedade afim gerada por v;,...,Vv, tem dimensão r — 1. 
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Transformações Lineares 


A Álgebra Linear pode ser apresentada sob três pontos de vista equi- 
valentes: transformações lineares, matrizes ou formas quadráticas. 
A ênfase (ou até mesmo a exclusividade) que se dá a uma dessas 
abordagens é muitas vezes uma questão de hábito, gosto pessoal ou 
convicção. Neste livro, os três aspectos serão devidamente tratados 
porém a primazia será concedida às transformações lineares, pelos 
três motivos apontados, principalmente o último. 


Sejam E, F espaços vetoriais. Uma transformação linear A: E > F 
é uma correspondência que associa a cada vetor v E E um vetor 
A(v) = A-v = Av € F de modo que valham, para quaisquer u,v € E 
exeR, as relações: 


A(u+v) = Au + Av, 
A(a-v) = «- Av. 


O vetor A -v chama-se a imagem (ou o transformado) de v pela trans- 
formação A. 

Se A: E > F é uma transformação linear então À -O0 = O. Com 
efeito, A-0 = A(0+0) = A-0-+A-0. Além disso, dados u,v e E e 
«,p ER, tem-se A(«u + Bv) = A(c«u)+ A(Bv) = «- Au+ B - Av. Mais 
geralmente, dados v,,...,vm em Ee qy,...,am ER, vale 


Aloyvi + Hamm) = 03º Avi+-+am Avm. 


Daí resultam A(—-v) = —-Ave A(u—v) = Au — Av. 
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A soma de duas transformações lineares A,B: E >» Fe o produto 
de uma transformação linear A: E > F por um número « E R são 
as transformações lineares A+ B:E > Fe «A: E — F, definidas 
respectivamente por (A + B)jv = Av+Bve («A)v = « - Av, para todo 
v € E. O símbolo O indica a transformação linear nula 0: E > F, 
definida por O-v = 0 e, definindo —A: E > F por (-A) .v = —Av, 
vê-se que (-A)+A=A+(-A)=0. 

Seja L(E;F) o conjunto das transformações lineares de E em F. As 
definições acima tornam L(E;F) um espaço vetorial. Quando E = F, 
usaremos a notação £L(E) em vez de £L(E;E). As transformações li- 
neares A: E — E do espaço vetorial E em si mesmo são chamadas 
operadores lineares em E. Por sua vez, as transformações lineares 
q: E > R, com valores numéricos, são chamadas funcionais linea- 
res. Escreve-se E* em vez de L(E;R) e o conjunto E* dos funcionais 
lineares q: E > R chama-se o espaço vetorial dual de E. 

Um operador linear especial é o operador identidade 1: E 5 E, 
definido por 1.v = v para todo v € E. Quando for necessário especifi- 
car, escreveremos 1; em vez de 1. 

Uma transformação linear A: E — F é um tipo particular de 
função que tem o espaço vetorial E como domínio e o espaço F como 
contra-domínio. Em geral, para se definir uma função f:X > Y 
é necessário especificar o valor f(x) para cada elemento x no seu 
domínio X. O que torna as transformações lineares tão manejáveis 
é que, para se conhecer À E £(E;F), basta que se saibam os valores 
A -v que À assume nos vetores v € B, onde 6 é uma base de E. Isto 
é particularmente útil quando E tem dimensão finita. Neste caso, 
um número finito de valores A -vy,...,AÃ - vn (onde (vy,...,Vn) E E 
é uma base) atribuídos arbitrariamente, definem inteiramente uma 
transformação linear A: E > F. Mais precisamente, vale o 


Teorema 4.1. Sejam E, F espaços vetoriais e 5 uma base de E. A 
cada vetor u € B, façamos corresponder (de maneira arbitrária) um 
vetor u” E F. Então existe uma única transformação linear À: E > F 
tal que À -u=u para cada u € B. 


Demonstração: Todo vetor v € E se exprime, de modo único, como 
uma combinação linear v = «yu + --- + amum de elementos uy,... 
«..,Um da base B. Definimos A: E —> F pondo 
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Dados v, w € E temos 


vV= qu +: +aÂamum 





w = Bju ++ Bmm. 


(Mesmo que a base B seja infinita, podemos exprimir v e w como 
combinações lineares dos mesmos elementos de B, completando com 
coeficientes zero os múltiplos dos u; que aparecem apenas numa das 
duas expressões.) Então 


v+w=5 (m+ Bi 


ia 
logo 
Alv+w) = E(x + Bu = Leu +EBu, =A-v+HA-m. 


De maneira análoga se vê que A(av) = « - Av, portanto A: E > F, 
assim definida, é uma transformação linear, tal que ÀA -u = u”, para 
todo u E 5. Quanto à unicidade, seja B: E —> F outra transformação 
linear tal que B-u = u' para todo u E B. Então, para cada v = 
Lau; € E tem-se 


B.v=B(Lau)=La-Bu=La-u=A-v 











portanto B = A. Isto completa a demonstração. 





Em virtude do Teorema 4.1, se quisermos definir uma transfor- 
mação linear A: R” — R” basta escolher, para cada j = 1,...,n, 
um vetor v; = (01;,02,...,0mj) € R” e dizer que v; = A-eéa 
imagem do j-ésimo vetor da base canônica, e; = (0,...,1,...,0), pela 
transformação linear A. A partir daí, fica determinada a imagem 
A -v de qualquer vetor v = (x1,...,Xn) € R”. Com efeito, tem-se 
v=x,e1+-:-- + xnen, logo 


n 


n n 
A-v=A 2 ve = DoxA “6 = 3 (ay; kras + Eng) 
j=1 j=1 j=1 


n n n 
= ) 15X, ) 02X...» ) AmjX; |» 
j= j= j=1 
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ou seja, 

A Rigs = (Upa age ess 
onde 

VI — Qj1X1 + ax + --- + Am 

Y2 = 021X1 + 022X2 + --- + mn 





(8) 


Um = AmiX1 + Am2X2 + *-- + AmnXn- 


Resumindo: uma transformação linear A:R” — RM fica intei- 
ramente determinada por uma matriz a — [aj] e M(m x n). Os 
vetores-coluna dessa matriz são as imagens A - e; dos vetores da 
base canônica de R”. A imagem A - v de um vetor arbitrário v = 
(x1,...,Xn) ERP é o vetor w = (y1,...,ym) E R” cujas coordenadas 
são dadas pelas equações (*) acima, nas quais ocorrem os vetores- 
linha da matriz a. Diz-se que a é a matriz da transformação A rela- 
tiva às bases canônicas de R” e R?. Tem-se 


m 
AB =5 ae; (j = san), 
i=l 


onde os e; estão em R" e os e; em RP. 

Em particular, a matriz de um funcional linear q: Rº > R é do 
tipo 1 x mn, logo pode ser escrita simplesmente como [a1, a2,..., an], 
onde a; = q(e;). Para todo vetor x = (x1,...,xn) € R” tem-se q(x) = 
XxX + + AX. 

Na situação dual, uma transformação linear A:R — R” é dada 
por uma matriz n x 1, cuja única coluna é o vetor v = A-1 = 
(a1,..., an). (A base canônica de R* = R tem um único elemento 
ey = 1.) Assim, a transformação linear A:R > R” fica inteira- 
mente determinada por um único vetor v E R”. Tem-se À -t=t-v 
para todo t E R. Evidentemente, o mesmo se pode dizer de toda 
transformação linear A:R > F, seja qual for o espaço vetorial F: 
conhecendo v = A-1€eFtem-se À .t=tvparatodoteR. 


Exemplo 4.1. Se dim E = 1, todo operador A: E > E é do tipo 
A = al, isto é, existe uma constante « E R tal que Av = av para 
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todo v E E. Com efeito, seja u € E um vetor não-nulo. Então (ul c E 
é uma base: todo vetor em E é múltiplo de u. Portanto existe « € R 
tal que Au = au. Para qualquer outro vetor v E E, temos v = Au 
portanto Av = A(Au) = AAu =Acu=a(Au) = av. 








Exemplo 4.2. (Rotação de ângulo O em torno da origem em 
R2.) Trata-se do operador R: R? > R?, que leva cada vetor v no vetor 
Rv que dele resulta pela rotação de ângulo O em torno da origem. A 
Fig. 4.1 deixa claro que R(u-+v) = R-u+R.v. É bem mais claro ainda 
que R(av) =a-Rvparave R?ea« E R, logo R é uma transformação 
linear. Para um vetor v = (x,y) € R? arbitrário, seja R-v = (x',y'). 
Sabemos que x' = ax+byey' =cx+ dy e 








Figura 4.1 - Rotação de vetores. 


queremos determinar a matriz 


al 


onde Rey = (a,c)eRez = (b,d), come, = (1,0) e es = (0,1). 

Ora, pelas definições de seno e cosseno, o vetor unitário Rey, 
que forma com e, um ângulo 0, tem coordenadas cos0 e senO, ou 
seja, Rey = (cos0,sen0). Além disso, como e; forma com e; um 
ângulo reto, Re; também forma com Re; um ângulo reto. Logo Re; = 
(— sen 0, cos 0). (Veja Fig. 4.2.) 
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Figura 4.2 - Rotação de ângulo 0. 


Portanto, a rotação R: R? — R? leva um vetor v — (x,y) no vetor 
Rv = (x,y), onde 


x =xcos0 — y sen 0; 


'=xsenO0 +vycoso. 


A matriz de R relativa à base canônica de R? é 


cos0 —senôO 
senO  cos0 |' 


Exemplo 4.3. (Projeção ortogonal sobre uma reta.) A reta y — 
ax é o conjunto dos pontos (x, ax) E R”, onde x varia em R. Ela é 
o subespaço vetorial de R? gerado pelo vetor (1,a). Consideremos 
o operador P:Rº? — Rº que faz corresponder a cada v = (x,y) € 
R? o vetor Pv = (x',ax'), cuja extremidade é o pé da perpendicular 
baixada de v sobre a reta y = ax. (Veja Fig. 4.3.) 
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Figura 4.3 - Projeção ortogonal sobre uma reta. 


Queremos determinar x" em função de x e y, o que nos dará as 
coordenadas (x', ax”) de Pv em função das coordenadas de v. No caso 
particular em que a = 0, a reta y = ax é o eixo das abcissas e a 
projeção Pv é simplesmente igual a (x,0). As equações da projeção P 
sobre o eixo horizontal são portanto x' = x,y' = 0. A matriz de P na 


ai sul . 
base canônica de Rº é | 0 o . No caso geral, a extremidade do vetor 


Pv é o vértice do ângulo reto num triângulo retângulo cujos demais 
vértices são a origem e a extremidade do vetor v. Pelo teorema de 
Pitágoras, temos 


dist(v,0)? = dist(Pv, 0)? + dist(v, Pv)?, 
ou seja, 
2 +y" = (x) +a(x) + (x—x 2 + (y— ax). 


Suponhamos x' < O. Desenvolvendo, simplificando e dividindo am- 
bos os membros por x”, obtemos (1 + a?)x! = x + ay, donde 
o x+ay 1 a 


e TÁ 
————s. ou seja = ' 
i Ita?” PRE ser Eq ua 





O caso x' = 0 significa que v = (x,y) está sobre a perpendicular à reta 
y = ax passando pela origem. Ora, a equação dessa perpendicular 
é x+ ay — 0, logo a expressão x' — (x + ay)/(1 + a?) fornece x' 
em função de x e y em todos os casos. Vemos, em particular, que 


Seção 4 Transformações Lineares 45 


a projeção P: R? — R? é um operador linear, cuja matriz na base 
canônica de R? é 











Tra? Tra? 





Exemplo 4.4. (Reflexão em torno de uma reta.) Seja S:Rº? >R? 
a reflexão em torno da reta y — ax. Para todo v — (x,y) E R?, a reta 
y = ax é a bissetriz do ângulo entre v e Sv e é perpendicular à reta 
que liga v a Sv. Seja P:R? — R? a projeção ortogonal sobre a reta 
y = ax. À Fig. 4.4 mostra que, para todo v € Rº, tem-se v+Sv = 2Pv, 
ou seja, que I+S = 2P, onde I: R? — R? é o operador identidade. Daí 
vem S = 2P — T. Usando o exemplo anterior, concluímos que, para 
todo v = (x,y), tem-se Sv = (x',y'), onde 


, 1-a | 2a p 2a l-=e 








E TE T+ a * É Tan ao Eae 











Figura 4.4 - Reflexão em torno de uma reta. 


Exemplo 4.5. Como vimos acima, o único tipo de funcional linear 
p:R” > Réo da forma q(v)=a;x;+---+anxn, para v = (x1,...,Xn). 
Por outro lado, se E = Cº([a,b]) é o espaço vetorial das funções 
contínuas f: [a, b] » R, podemos definir o funcional linear q: E > R 
pondo 


Outro exemplo de funcional linear £ em E consiste em fixar um ponto 
c E la,b] e definir, para cada f c E, E(f) = f(c). Ainda no contexto 
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do espaço de funções E = Cº([a,b]), podemos definir um operador 
linear K: E — E do seguinte modo: fixamos uma função contínua 
k: [a,b] x [a,b] > R, de duas variáveis, e fazemos corresponder a 
cada f E E a função g = Kf E E dada por 


b 
9x) -| kbx, ufa) dy. 


Finalmente, temos o importante operador de derivação D: CS(R) > 
CO(R), definido por Df = f' = derivada de f. Ele também pode ser 
considerado, de forma mais restrita, como um operador D: P, > Ph, 


onde 
n n 
ata 
D [> ooº) = ) LO 
i=0 i= 


ou, de forma mais ampla, como uma transformação linear 
D: CM(R)> CH !(R), para k > 0. 


Exercícios 


4.1. Prove que se A,B: E — F são transformações lineares e « é 
um número real então A + Be «A, conforme definidas no texto, são 
transformações lineares. 


4.2. Sejam R,P,S:Rº? — Rº respectivamente a rotação de 30º em 
torno da origem, a projeção ortogonal sobre a reta y = x/3 e a re- 
flexão em torno da mesma reta. Dado o vetor v = (2,5), determine 
os vetores Rv, Pv e Sv. 


4.8. Assinale verdadeiro (V) ou falso (F): 
E dada uma transformação linear À: E 5 F. 


( )SeveEétalque Av=0Oentãov=0. 
( ) SeAw=Au+Aventãow=u+v. 


( ) Sev é combinação linear de w,...,um então Av é combinação 
linear de Auy,..., AUm. 


( ) Seu,v,w € E são colineares (isto é, pertencentes a uma mesma 
reta) então Au, Av e Aw são colineares. 
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44. Seja A:R? > Rº a projeção sobre o eixo x, paralelamente à 
reta y = ax (a + 0). Isto significa que, para todo v = (x,y), tem- 
se Av = (x',0), tal que v — Av pertence à reta y = ax. Exprima x' 
em função de x e y e escreva a matriz de A relativamente à base 
canônica de R?. 


4.5. Dados os vetores uy = (2,-1),u = (1,1),uz = (—1,-4), vi = 
(1,3), vz = (2,3) ev3 = (—5, —6), decida se existe ou não um operador 
linear A:R? — R? tal que Au, = v;, Au = v, e Aus = v3. Mesma 
pergunta com vz = (5, —6) e com v3 = (5,6). 


4.6. A expressão geral de um operador linear A: R? > R? é A(x,y) = 
(ax + by, cx + dy). Determine as constantes a, b, c e d de modo que 
A transforme os vetores u = (1,2) ev = (3,4) nos vetores Au = (1,1) 
e Av = (2,2). 


4.7. A expressão geral de um funcional linear f: Rê»R é f(x,y,2z) 
ax + by + cz. Dados os vetores u = (1,2,3), v = (-1,2,3) e w = 
(1,-—2,3), determine a, b e c de tal modo que se tenha f(u) = 1, 
f(v) =0ef(w) = 0. 


4.8. Seja A:R? — R? 0 operador linear definido por A(x,y) = (5x + 
4y, —3x — 2y). Ache vetores não-nulos u = (x,y) ev = (s,t) tais que 
Au=ue Av=2v. São únicas as soluções? Será possível achar w £ O 
emRº com Aw=ow,ondeatlea*2? 


4.9. Dê as expressões dos funcionais lineares f,g,h: RÉ > R que 
formam a base dual em (Rº)* da base (u, v,w) € Rº, ondeu = (1,1,1), 
v=(1,-1,])ew=(1,1—1). (Vide Exercício 4.20.) 


4.10. Tem-se uma transformação linear A: R? — Rº. Sabe-se que 
A(—1,1) = (1,2,3) e A(2,3) = (1,1,1). Pede-se a matriz a e M(3 x 2) 
de A relativamente às bases canônicas de R? e Rº. 


4.11. Prove que uma transformação linear A: E — F transforma 
todo conjunto convexo € c E num conjunto convexo A(C) c F. 


4.12. Determine a expressão do operador linear A:R? — R?, sa- 
bendo que, para todo v = (x,y), o segmento de reta que liga v a 
Av = (x',y') é horizontal e tem seu ponto médio sobre a reta y = x. 
Qual é a imagem do eixo vertical pelo operador A? 


4.13. Prove que os operadores lineares E, E12, E21, E: Rê > R?, 
definidos por Esil, 1) = 8,0) Ej(x,y) = (0,5%); Es (x,y) = (u,0), 
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Ex(x,y) = (0,y), constituem uma base do espaço vetorial L(R?). 
Prove ainda que outra base deste espaço pode ser formada com os 
operadores A, B, €C, I, onde A(x,y) = (x + 3y,y), B(x,y) = (x,0), 
Clisuy) = (x+yx—u) e Il,y) = (x,y). 

4.14. Verifique que as funções definidas nos Exercícios 3.32 e 3.33 
são funcionais lineares. 


4.15. Seja A: E > F uma transformação linear 


(a) Se os vetores Avi,..., Avm E F são L.I., prove que vy,...,vm € E 
também são L.I.. 

(b) Se F = E e os vetores Avi,..., Avm geram E, prove que vy,...,Vm 
geram E. 


(c) Valem as recíprocas de (a) e (b)? Seria (b) verdadeira com F Z E? 
4.16. Quais das transformações abaixo são lineares? 

(a) A:Rê SR, A(x,y,2) = (x,23,27). 

(b) A:Rê SR, A(x,y,2z) = (3x,0,5z), onde a E R. 

(co) ALR SR,Alxyzw)=(x-wy—-w,x+z). 

(d) A:M(nxn) 5 R”, A(la;)) = (am, 022,...,0nn). 

(e) A:CAAR) 5SCAR), Af=31" 21 +1. 























(£ A:MIx)SR,A (Ie à) — ad-be. 

4.17. Sejam A: E — F uma transformação linear e E' Cc E, F CF 
subespaços vetoriais. Prove que A(E”) = (Av;v € E”) é um subespaço 
deFe A-!(F) = fv E E;Av E F) é um subespaço de E. SeV c E 
eW c F são variedades afins, prove que os conjuntos A(V) CFe 
A!(W) c E, definidos analogamente, são também variedades afins. 


4.18. No exercício anterior, prove que se E” tem dimensão finita 
então dim A(E”) é finita e dim A(E”) < dim EF”. Dê um exemplo de 
um operador não identicamente nulo A: R? — R? e um subespaço 
EC R?tal que dim A(E”) < dim E”. Prove também que se E e F têm 
dimensão finita e A é sobrejetiva então dim A! (F”) > dim F. Dêum 
exemplo em que À Z 0e dim A!(F”) > dim F. Dê também um exem- 
plo (com dim E = oo), onde dim F' é finita mas dim A !(F” = oo. 


4.19. Dados os espaços vetoriais E, F, prove que L(E;F) é um subes- 
paço vetorial de F (E;F). (Vide Exercício 1.15.) 
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4.20. Seja V = (vi,...,vVvn) uma base do espaço vetorial E. Para 
cada i = 1,2,...,n, seja f;: E > Ro funcional linear determinado 
(conforme o Teorema 4.1) pelas condições fi(v;) — 1, fi(v)) — 0 se 
j £ 1. Prove que (fj,...,fnj é uma base de E* 


=— £(E;R) (chamada 
a base dual da base V). Mostre que se tem f;(v) = x; para todo 


v=xv + +XMM EE. 


4.21. Seja f: R? — R um funcional linear. Sabendo que f(1,1]) = 3 e 
f(2,3) = 1, calcule f(1,0) e f(0,1). 


4.22. Seja A: R? — R? o operador linear dado por A(x,y) = (ax + 
by, cx + dy), com ad — bc £ 0. Prove: 


(1) Para todo v £ O em Rº, tem-se A.v £ 0. 


(2) Toda reta R C R? (variedade afim de dimensão 1) é transfor- 
mada por À numa reta. 


(3) A transforma retas paralelas em retas paralelas. 


4.23. Determine « de modo que as retas perpendiculares em R?, de 
equações y = ax ey = —x/« sejam transformadas em retas per- 
pendiculares pelo operador linear A: R? — Rº, dado por A(x,y) — 
(2x + 3y, x — 2y). 


4.24. Sejam E, F espaços vetoriais de dimensão finita. Dados os 
vetores v1,...,Vm E Ee my,...,Mm E F, à fim de que exista uma 
transformação linear A: E — F com Av; = wy,...,Avm = Wm, É 
necessário e suficiente que, para toda combinação linear nula «vi + 
“+ &mVm = 0, se tenha também cw, + --- + amwm = O. 


4.25. Seja v um vetor não-nulo de um espaço vetorial E, de dimensão 
finita. Dado qualquer espaço vetorial F (0), mostre que existe uma 
transformação linear A: E > Ftal que Av 0. 


4.26. Seja E um espaço vetorial de dimensão finita. Dada uma base 
F =(f,...,fn) C E*, mostre que existe uma base (v,...,vn) C E da 
qual F é dual. (Veja Exercício 4.20.) 


4.27. Seja Y um conjunto de geradores do espaço vetorial E. Se as 
transformações lineares A, B: E — F são tais que Aw = Bw para todo 
w E Y, prove que Av = Bv para todo v € E. 
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4.28. Seja X = (vy,..., vm) um conjunto L.I. no espaço vetorial E, 
de dimensão finita. Dados arbitrariamente os vetores w1,...,Wm No 
espaço vetorial F, prove que existe uma transformação linear A: E > 
Ftal que Av; = wWwy,...,Avm = Wm. À é única se, e somente se, X é 
uma base de E. 


4.29. Uma transformação T: E > F, entre espaços vetoriais, cnama- 
se afim quando se tem T((1—t)u+tv) = (1—-t)Tu-+tTv para quaisquer 
u,veEeteR. Dada a transformação afim T: E > F, prove: 


(a) Toda variedade afim V c E é transformada por T numa variedade 
afim V' c F. 


(b) Se T.O = 0, então, escrevendo av = (1 — «)0 + av, resulta que 
T(av) = «- Tv para quaisquer «e R, ve E. 

(c) Supondo ainda T. O = 0, a relação T(5(u+v)) = 5(Tu + Tv), 
implica que T(u +v) = Tu + Tv para quaisquer u,v € E. 

(d) Para todo b E F, a transformação S: E — F, definida por Sv = 
Tv+b também é afim. 


Conclua que T: E > F é uma transformação afim se, e somente 
se, existem À E Z(E;F) eb € Ftais que Tv = Av+b para todo v E E. 


4.30. Seja H c R” um subespaço vetorial de dimensão n — 1. 

Tome uma base V c H, formada pelos vetores vj,...,Vn-1, onde 

vi= (o... Gin) i=1,...on—]1. Use o fato de que o sistema de 
n 


equações lineares > «;jx; — 0, com n—1 equações e n incógnitas, ad- 
j=1 

mite uma solução não-trivial para concluir que existem n números 

q1,...,Qn tais que v = (x1,...,Xn) pertence a H se, e somente se, 

ax, + --- + anxn = 0. (Todo subespaço vetorial de R” com dimensão 

n — 1 é um hiperplano, isto é, é o conjunto das soluções de uma 


equação linear homogênea.) 


o 


Produto de 


Transformações Lineares 


O produto de transformações lineares, que introduziremos nesta 
seção, é um exemplo concreto de estrutura algébrica que apresenta 
variados e interessantes fenômenos, não encontrados nas operações 
entre números ou entre vetores. 


Dadas as transformações lineares A: E > F, B:F > G, onde o 
domínio de B coincide com o contra-domínio de A, define-se o produto 
BA: E > G pondo, para cada v e E, (BA)v = B(Av), 


E de É > 6 
See 22 W 
BA 


Vê-se imediatamente que BA é uma transformação linear. Ob- 
serve-se também que BA nada mais é do que a composta B o À das 
funções B e A. Segue-se então dos princípios gerais que se C:G >» H 
é outra transformação linear, vale a 
Associatividade: (CBJA-C(BA). 

A linearidade tampouco é necessária para mostrar que, dadas 
A:ESFeB,C:F> G, tem-se a 
Distributividade à esquerda: (B + C)JA = BA+ CA, que decorre 
simplesmente da definição de B+C. 

Usando a linearidade de C: F > G, vê-se que, dadas A,B: E > F, 
vale a 
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Distributividade à direita: C(A+B) -CA+CB. 
Com efeito, para todo v € E, tem-se 


[C(A + B)lv = CI(A + B)v] = C(Av + Bv) = C(Av) + C(Bv) 
= (CA)v+ (CB)v = (CA + CB)v. 


Exemplo 5.1. Sejam f,g,h: R > R definidas por f(x) = x, g(x) = 
x+1eh(x) = x?. Então [ho (f + gl(x) = 4x? +4x + 1, enquanto 
(hof)+(hogll(x) =2x+2x+1,logoho(f+9g) £hof-+hog. Isto 
se dá porque h não é linear. 

Outra consequência da linearidade de B é a 
Homogeneidade: B(«A) = a«(BA), válida parax« ER, A:ESFe 
B: F> G quaisquer. 

Evidentemente, dada A: E — F, tem-se Al — À = IA, de modo 
que as aplicações identidade IE: E > E, Ip: F > F são elementos 
neutros para a multiplicação, cada uma delas do lado apropriado. 

Diferenças notáveis entre o produto de transformações lineares 
e o produto de números reais são as ausências da comutatividade, 
da lei do corte e da inversa multiplicativa para uma transformação 
* 0, além da presença de transformações nilpotentes, para as quais 
tem-se A” = O com À £ 0. Deve-se ainda mencionar a restrição de 
que o produto BA só está definido quando À toma valores no domínio 
de B. Esta restrição desaparece, naturalmente, quando se trata de 
operadores lineares no mesmo espaço E: então o produto BA está 
definido quaisquer que sejam A,B ec Z(E). 


Exemplo 5.2. Sejam P,R: R? — Rº respectivamente a projeção orto- 
gonal sobre a reta y = x e a rotação de um ângulo de 90º em torno da 
origem. Então, para todo v = (x,y) € Rº, tem-se Pv = 1(x+y,x +), 
Rv = (—y,x). Segue-se que 


1 


RPv= 31X X+U) 


1 
PRv = 78 UX—U). 


Portanto RPv < PRv para todo v, exceto para v = (0,0). Observe que 
bastaria que RPv < PRv para um único v a fim de termos RP < PR. 
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Exemplo 5.3. Seja P: R? — Rº a projeção ortogonal sobre uma certa 
reta r. Para todo v sobre a reta r, tem-se Pv = v. Assim, para qual- 
quer v € R?, tem-se PPv = Pv, pois Pv está sobre r. Noutras palavras, 
vale PP = P, ou seja PP = PI, embora P £ I. Assim, não é per- 
mitido cortar o fator P à esquerda em ambos os membros da igual- 
dade PP — PI. Segue-se que não existe Q E L(R?) tal que QP — I. 
Com efeito, se um tal operador Q existisse, de PP = P concluiríamos 
QPP = QP, isto é, IP = I, donde P = 1. 


Exemplo 5.4. Sejam P,Q: R? — Rº projeções ortogonais sobre duas 
retas do plano, uma das quais é perpendicular à outra. Todo vetor 
v € Rº é a diagonal de um retângulo que tem Pv e Qv como lados. 
(Veja Fig. 5.1.) 





Figura 5.1. 


Segue-se então que v — Pv+Qv para todo v € Rº,ouseja, PFQ —1 
eQ=I-P. Portanto PQ =P(I-P)=P-P2=P-P=0. Obtemos 
assim dois operadores não-nulos P, Q com PQ = 0. É possível mesmo 
que um operador não-nulo A Ee £(R?) cumpra A? = 0. Basta pôr 
Aly) =(x—y,x—uy). 

Um operador À chama-se nilpotente quando, para algum n E N, 
tem-se A” = 0. Um exemplo significativo de operador nilpotente é a 
derivação D: P, — Ph. Para todo polinômio p de grau < n tem-se 
Dr o = 0, logo D+! = 6, 


Exemplo 5.5. Se Rw,Rp: R? — R? são rotações em torno da origem 
com ângulos « e ? respectivamente, então R« - Rg = Rw+p. (Isto pode 
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ser visto geometricamente na Fig. 5.2 ou usando as fórmulas de 
cos(a-+ ) e sen(a+)). Se S: R? > R? é a reflexão em torno de uma 
reta então S.S = I. Isto se segue da expressão S = 2P — I, levando 
em conta que P-P = P, mas também pode ser visto geometricamente 
(com mais facilidade). 


RaRpv=RapV Rev 





Figura 5.2 — Rotações do plano. 


Exercícios 


5.1. Verifique explicitamente que o produto BA de transformações 
lineares é ainda uma transformação linear. 


5.2. Considere os operadores lineares R,S,P: R? — R?, onde Ré a 
rotação de 30º em torno da origem, S é a reflexão em torno da reta 
y=2xePéa projeção ortogonal sobre a mesma reta. 


(1) Mostre que se tem PS = SP =P. 
(11) Verifique a igualdade RSR =S. 
(111) Mostre que R não comuta com S nem com P. 
(iv) Determine todos os vetores v tais que PRv = 0e RPv £0. 
5.3. Dado o operador linear A: E > E, seja N o conjunto dos vetores 


v € E tais que Av = 0. Mostre que N é um subespaço vetorial de E. 
Prove que A? = 0 se, e somente se, para todo v € E tem-se Av E N. 
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5.4. Sejam R,R': R? — Rº respectivamente as rotações de ângulos O 
e 9 em torno da origem. Partindo do fato de que o produto RR' é a 
rotação de ângulo 0 + 0”, use o Exemplo 4.2 para obter as fórmulas 
clássicas cos(0 + 0) = cos 0 - cos 0º — sen O - sen 0º e sen(0 + 0) — 
sen 0 .cos 0'+ sen 0. cos 0. 


5.5. Seja A: E > E um operador nilpotente. Prove que existe algum 
vetor v £ 0 em Etal que Av =0. 


5.6. Dados os operadores A, B: R? — R? dados por A(x,y) = (x+v,0) 
e B(x,y) = (—y,x), obtenha as expressões dos operadores À + B, 
AB, BA, A? e B?. Descreva geometricamente esses cinco operadores. 
(Exemplo: A é a projeção sobre o eixo x paralelamente a uma certa 
reta. (Qual?)) 


5.7. Seja A: Rº — Rº dado por A(x,y,z) = (ay + bz, cz,0). Mostre 
que Aº — 0. 


5.8. Sejam A,B,C,D:R? — Rº os operadores dados por A(x,y) = 
(x,0), Blx,y) = (>y,x), Clx,y) = (0,y) e D(x,y) = (y,—x). Deter- 
mine o operador ABCD. 





5.9. Considere as transformações lineares A:R? Re B:Rº 5R?, 
definidas por: A(x,y) = (x,y,x+y) e B(x,y,z) = (ax+(a— D)y+(1 
a)z, -bx + (1 — b)y + bz). Determine o operador BA: R? — 














5.10. Dado o operador A: R? — R?, com A(x,y) = (3x — 2y,2x + 7y), 
ache um vetor não-nulo v = (x,y) tal que Av = 5v. 


5.11. Sejam A,B: E — E operadores lineares. Suponha que existam 
vetores u,v € E tais que Au e Av sejam L.D.. Prove que BAu e BAv 
são L.D.. Se a dimensão de E for igual a 2, prove também que ABu 
e ABv são L.D.. (Sugestão: seu e v são L.D. o fato é óbvio. Caso 
contrário, u e v formam uma base de E. Exprima Bu e Bv em termos 
dessa base e depois aplique A.) 


5.12. Sejam A,B:Rº — Rº definidos por A(x,y,z) — (x,y,0) e 
B(x,y,z) = (x + z,1,0). Obtenha vetores u,v € Rº tais que Au e 
Av sejam L.D. porém ABu e ABv sejam L.l.. 


5.13. No espaço vetorial P dos polinômios, considere os operadores 
lineares D,A:P > P de derivação (Dp(x) = p'(x)) e multiplicação 
por x (Ap(x) = xp(x)) respectivamente. Determine DA — AD. 
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5.14. Seja A: R? — Rº o operador linear definido por A(x,y) = (ax + 
by, cx + dy). Verifique que A? — (a + d)A = (bc — ad)I. Use esta 
igualdade para provar que, se ad— bc < 0, existe um operador linear 
B:Rº>R?talqueBA=AB=I. 


5.15. Seja C(A) o conjunto dos operadores lineares X: E > E que 
comutam com o operador À E L(E) (isto é, AX = XA). Prove que C(A) 
é um subespaço vetorial de L(E)e que X,Y E C(A) > XY e C(A). 


5.16. Seja A: R? — R? um operador linear que não é da forma al. 
Prove: 
(a) Existe w € Rº tal que (w, Aw — w) C Rº é uma base. 
(b) Se P:R? — R? é o operador que a cadav= xw + y(Aw —- w) ER? 
faz corresponder Pv = xw então AP Z PA. 

Conclua que os únicos operadores lineares em R? que comutam 
com todos os demais são os da forma al. 














5.17. Estenda o exercício anterior para todos os espaços vetoriais de 
dimensão finita (maior do que 1) em vez de R?. 


5.18. Sejam A: E > F uma transformação linear e B: F > E uma 
função tal que AB = Ir e BA = IE. Prove que B é uma transformação 
linear. 


5.19. Seja E um espaço vetorial de dimensão n. Para todo k = 
2,...,n, exiba um operador linear A: E — E tal que At = O mas 
A) £Osej<k. 


5.20. Sejam A,P: E — E operadores lineares não-nulos tais que 
AP = 0. Prove que existem vetores diferentes de zero u 4 v com 
Au = Av. 


5.21. Sejam A: Rº? — R? um operador linear e P:Rº? > Rº a projeção 
ortogonal sobre uma reta r (passando pela origem). Prove que as 
seguintes afirmações são equivalentes: 

(a) Para todo v ET tem-se Av Er. 

(b) PAP — AP. 


5.22. Seja X: F > G uma transformação linear tal que Xw £ 0 para 
todo w £ O em F. Prove que se A,B e £(E;F) cumprem XA = XB 
então À = B. 


Seção 5 Produto de Transformações Lineares 57 


5.23. Seja X: E —> F uma transformação linear com a seguinte pro- 
priedade: para cada w € F existe (pelo menos) um vetor v € E tal que 
Xv = w. Suponha que A, B e L(F;G) cumprem a igualdade AX = BX. 
Prove que À = B. 


5.24. Sejam A,B: E > F transformações lineares tais que, para todo 
operador linear X: F — F, tem-se XA=XB. Prove que A=B. 
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Núcleo e Imagem 


Nesta seção, será examinada com cuidado a possibilidade de uma 
transformação linear admitir ou não uma inversa. Veremos que isto 
está associado à existência e à unicidade da solução de um sistema 
de equações lineares. Será introduzido o conceito de isomorfismo, que 
dará um sentido preciso à afirmação de que dois espaços vetoriais de 
mesma dimensão são algebricamente indistinguíveis. Tudo começa 
com o núcleo e a imagem de uma transformação. 


A toda transformação linear A: E > F estão associados dois sub- 
espaços vetoriais indispensáveis para estudar o comportamento de 
A: o núcleo de A, que é um subespaço de E, e a imagem de A, que é 
um subespaço de F. 

À imagem de À é o subconjunto Zm(A) C F, formado por todos 
os vetores w = Av € F que são imagens de elementos de E pela 
transformação A. 

A noção de imagem tem sentido seja qual for a função A: E > F, 
seja linear ou não. Quando A é linear, então Zm(A) é um subespaço 
vetorial de F, como se vê facilmente. 

Se Zm(A) = F, diz-se que a transformação A é sobrejetiva. Isto 
significa que, para qualquer w € F dado, pode-se achar v € E tal que 
A-v=W. 

Seja X c E um conjunto de geradores do espaço vetorial E. A 
imagem da transformação linear A: E — F é o subespaço vetorial 
de F gerado pelos vetores Av, v E X. Em particular, À é sobreje- 
tiva se, e somente se, transforma X num conjunto de geradores de F. 
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Se v1,...,Vn geram E os vetores Avy,..., Av, geram ZTm(A). Segue- 
se que a dimensão de Zm(A) é menor do que ou igual à dimensão 
do domínio de A. Este fato será tornado mais preciso a seguir. 
(V. Teorema 6.6.) 


Exemplo 6.1. Dado um sistema linear de m equações an incógnitas 





ax + aux ++ amkmn =b 














ak ado dee detona — Da 


AmiX1 + Am2X2 + -*- + AmnXn = bm; 


seja A:R” — RM a transformação linear cuja matriz nas bases ca- 
nônicas de R" e R” é a = [ai]. Isto significa, como sabemos, que, 
paraj=1,...,n, os vetores 


m 
m 
v; = Ae; = > age = (Ojos Cyj) E R 
il 


são os vetores-coluna da matriz a. Em termos da transformação 
linear A, o sistema acima pode ser interpretado como o problema 
de achar um vetor x = (x1,...,Xn) € R” tal que Ax = b, onde b = 
(b1,..., bm). Portanto o sistema admite solução se, e somente se, o 
vetor b pertence à imagem da transformação linear À, o que equivale 
a dizer que os conjuntos (vi,...,Vn/ € (vi,...,Vn, Db) geram ambos o 
mesmo subespaço Zm(A). 


Exemplo 6.2. Um funcional linear f: E > R é sobrejetivo ou é 
igual a zero, pois (0) e R são os únicos subespaços vetoriais de R. 
A derivação D: CH(R) — CKH-!(R) é sobrejetiva, e o mesmo se dá 
com o operador D: C“(R) — CX(R) e com a transformação linear 
D:PMS Pr. SeP:R? > R? é a projeção ortogonal sobre uma reta 
r, a imagem de P é essa reta 7. 

Uma transformação linear B: F — E chama-se uma inversa à 
direita da transformação linear A: E — F quando se tem AB = Ir, ou 


seja, quando A(Bw) = w para todo w E F. 














Teorema 6.1. 4 fim de que uma transformação linear A: E > F, 
entre espaços vetoriais de dimensão finita, possua uma inversa à di- 
reita Be £L(F;E) é necessário e suficiente que A seja sobrejetiva. 
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Demonstração: Se A admite uma inversa à direita B: F > E então, 
para todo w E F tem-se A(Bw) = w, logo w = A -v, onde v = Bw, 
e À é sobrejetiva. (Aqui não se usou a linearidade de A, e muito 
menos a finitude das dimensões de E e F.) Suponhamos, em se- 
guida, que A seja sobrejetiva. A fim de definir uma transforma- 
ção linear B: F — E com A(Bw) = w para todo w E F, tomamos 


uma base 8 = (wy,...,Wm) EC F. Como À é sobrejetiva, podemos 
escolher vetores vj,...,vm E E tais que Avi = W1,...,AVm = Wm. 
Pelo Teorema 4.1, existe uma transformação linear B: F > E tal que 
Bw, = v1,...,Bwm = Vm. Afirmamos que, para todo w E F, tem- 


se A(Bw) = w. Com efeito, sendo B uma base, podemos escrever 
w=B;w+-- + BmWm, portanto 


A(Bw) = A(BiBw; + --- + BmBwm) 
= A(Biyvi +: + Bmvm) 
= B/Avi +-:-- + BmAvm 
=Biwm d+ +Bmnymn=4U. [1] 





Exemplo 6.3. Uma transformação linear sobrejetiva A: E > F 
pode admitir mais de uma inversa à direita B: F > E. Um exem- 
plo simples é dado pela transformação linear A:Rº — Rº, defi- 
nida por A(x,y,z) = (x,y). Fixados arbitrariamente a,b E R, a 
transformação linear B: R? — Rº, definida por B(x,y) = (x,y, ax + 
by), é uma inversa à direita para A. Variando os números a e b, 
obtemos infinitas possibilidades para B. 


Exemplo 6.4. Uma inversa à direita para a derivação D: Pu > 

P,n é a transformação linear J: P, > Pr, que a cada polinômio 

p(x) = ao+ajx+:--+anx” de grau < n faz corresponder o polinômio 
0.2 En .m4l 


Jplx) = ax + 7x ++ * 





O núcleo da transformação linear A: E > Fé o conjunto dos ve- 
tores v € E tais que Av = 0. Usaremos a notação N'(A) para repre- 
sentar o núcleo de A. É fácil ver que N(A) é um subespaço vetorial 
de E. 

Uma transformação linear A: E — F chama-se injetiva quando 
vv emE > Av Av em. Equivalentemente: Av= Av > v=V. 
Esta noção tem sentido para qualquer função A: E — F, seja ela 
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linear ou não. No caso linear, porém, o teorema abaixo simplifica a 
verificação da injetividade. 


Teorema 6.2. 4 fim de que uma transformação linear A: E > F 
seja injetiva é necessário e suficiente que seu núcleo N'(A) contenha 
apenas o vetor nulo. 


Demonstração: Seja À injetiva. Então ve N(A) > A-v=0= 
A-0=>5 v=0, logo N(A) = (0). Reciprocamente, seja N(A) = (0). 
Então Av= Av 5 A(v-v) =Av- AV =05v-V eN(A)> 
v—>V =0>5 v=V, logo À é injetiva. 














Teorema 6.3. Uma transformação linear é injetiva se, e somente se, 
leva vetores L.l. em vetores L.l.. 


Demonstração: Seja A: E — F uma transformação linear injetiva. 
Se os vetores v1,...,vn E E são linearmente independentes, vamos 
provar que suas imagens Av;,..., Av, são vetores linearmente inde- 
pendentes em F. Com efeito, se «y - Av; + --- + on - Av, = O então 
A(oyvi + --- + anvn) = 0, logo «vi + --- + anvn = O pois À é in- 
jetiva. Como vj,...,Vn são L.I., segue-se que q) = --- = àn = 0, 
portanto Avy,..., Av são L.I.. Reciprocamente se a transformação 
linear A: E > F leva vetores L.l. em vetores L.I. então v Z O em 
E> (vLI > (Av)LI > Av£oO, portanto N(A) = (0) e À é inje- 
tiva. 














Segue-se deste teorema que se E tem dimensão finitan e A: E > 
F é uma transformação linear injetiva então dim F > n. Assim, por 
exemplo, não existe uma transformação linear injetiva de Rº em R?. 


Teorema 6.4. Seja A: E — F uma transformação linear. Para todo 
be Zm(A), 0 conjunto V = (x E E;Ax = b), formado pelas soluções 
do sistema linear Ax = Db, é uma variedade afim em E, paralela ao 
núcleo N(A). 


Demonstração: Fixemos xo € V, isto é, com Axo = b. Afirmamos 
que V=xo+N(A). Com efeito, ve N(A) > Alxo +v) = Axo + Av= 
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b+0=b> x +vevV. Logo xo + N(A) c V. Reciprocamente, 


xeV>x=x+(x—xo)=x0+v 
> b=Ax=A(xo+v)=Axo4+Av=b+Av 
> b=>b+Av 
> Av=0 
>x=x+vexo +N(A). 














Logo V cxo+N(A). 


Observação. Geometricamente, o Teorema 6.4 significa que o espa- 
ço vetorial E se exprime como uma reunião de lâminas paralelas 
V = xo + N(A), cada uma das quais é uma variedade afim que 
se transforma por A num único ponto beZm(A). Este ponto, na- 
turalmente, varia quando se passa de uma lâmina para outra. (Veja 
Fig. 6.1.) 





Figura 6.1. 


Algebricamente, o Teorema 6.4 significa que, para cada b € 
Zm(A), obtêm-se todas as soluções x E E do sistema linear Ax = b 
assim: acha-se uma “solução particular” xo desse sistema e a solução 
geral x = xo +v é a soma dessa solução particular com a “solução ge- 
ral v do sistema homogêneo associado” Ax = 0. Naturalmente, esta 
última é um elemento qualquer do núcleo de A. Seb é Zm(A) então 
o sistema Ax = b, evidentemente, não possui solução. 


Exemplo 6.5. O núcleo de uma rotação ou de uma reflexão no plano 
R? reduz-se a (0). O núcleo da projeção ortogonal P: R? — R? sobre 
a reta r é a reta que contém O e é perpendicular a r. O núcleo da 


Seção 6 Núcleo e Imagem 63 


derivação D: C*(R) — CH !(R) é o subespaço uni-dimensional de 
CH(R) formado pelas funções constantes. O núcleo de um funcional 
linear não-nulo q: E > R é um hiperplano H c E. 

Sejam A:E >» Fe B:F > E transformações lineares. Diz-se que 
B é uma inversa à esquerda de A quando BA = 1x, isto é, quando 
B(Av) =v para todo v E E. 


Exemplo 6.6. Seja A: R? — Rº definida por A(x,y) = (x + 2y,2x + 
3y,3x + 4y). A transformação linear B: Rê — R?, dada por 


B(x,y, z) Fe (—3x + 2y, 2x = y) 
cumpre a relação 


B(A(x,y)) = B(x + 2u,2x + 3y, 3x + 4y) 
= (—3(x + 2y) + 2(2x + 3y), 2(x + 2y) — (2x + 3y)) 
== (x,y) 


para qualquer (x,y) € R?. Logo B é uma inversa à esquerda para A. 


Exemplo 6.7. Uma transformação linear pode admitir uma infini- 
dade de inversas à esquerda. Por exemplo, seja A:R? — Rº dada 
por A(x,y) = (x,y,0). Para quaisquer a,b E R, a transformação 
linear B:Rº — R?, dada por B(x,y,z) = (x + az,y + bz) é uma in- 
versa à esquerda de A, pois BA(x,y) = B(x,y,0) = (x,y) para todo 
(x,y) E R?. 


Teorema 6.5. Sejam E e F espaços vetoriais de dimensão finita. A 
transformação linear A: E — F possui inversa à esquerda se, e so- 
mente se, é injetiva. 

Demonstração: Seja B: F — E inversa à esquerda de A. Então 
Au = Av> u=B(Au)=B(Av) =v, logo À é injetiva. Reciproca- 
mente, suponhamos que A seja injetiva. A fim de obter uma inversa 


à esquerda B para A, tomemos (vi,...,vn) C E, uma base. Pelo Te- 
orema 6.3, os vetores Avi,..., Av, € F são L.I., logo podemos achar 
vetores wj,...,Wk € Ftais que 

(Avi... CS AÁVO WI. WkJ CF 


seja uma base. (Teorema 3.4.) Pelo Teorema 4.1, a fim de definir 
a transformação linear B: F > E, basta especificar seus valores nos 
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elementos desta base. Poremos B(Av;) = vj,...,B(Avn) = vn, Bw1 = 
0,...,Bw, = 0. Dado qualquer v E E, tem-se v = ayvi +: + Qnvn, 
logo 


BAv = B(xAvi +---+ ÔnAvn) 
= q«yBAv; +. + a«nBAvn 


= OqVI + + AV = V, 














portanto B é uma inversa à esquerda de A. 


Uma transformação linear A: E —> F chama-se invertível quando 
existe B: F — E linear tal que BA = Ip e AB = Iy, ou seja, quando B 
é, ao mesmo tempo, inversa à esquerda e à direita de A. 

Neste caso, diz-se que B é a inversa de A e escreve-se B= A!. 

A fim de que a transformação linear A seja invertível, é neces- 
sário e suficiente que ela seja injetiva e sobrejetiva. Diz-se, então, 
que A é uma bijeção linear entre E e F ou, mais apropriadamente, 
que A: E > F é um isomorfismo e que os espaços vetoriais E e F são 


isomorfos. 

Se A:E »FeB:F -— G são isomorfismos, então A !:F 5 Ee 
BA: E — G também são isomorfismos. Tem-se (BA)! = A IBe, 
para a 70, («AJ ! =. AT. 


Um isomorfismo A: E > F entre espaços vetoriais transforma 
toda base de E numa base de F. Reciprocamente, se uma transfor- 
mação linear A: E > F leva alguma base de E numa base de F então 
A é um isomorfismo. 

Do que foi dito acima resulta, em particular, que dois espaços 
vetoriais de dimensão finita isomorfos têm a mesma dimensão. A 
recíproca é verdadeira, como veremos agora. 

Com efeito, seja E um espaço vetorial de dimensão finita n. Fi- 
xando uma base (vi,...,Vn) C E, podemos definir uma transfor- 
mação linear A:R” — E pondo, para cada v = (w1,...,0n) E R?, 
Av = mv +: +onva. Tem-se Aey = v,...,Ãen = vn. Ássim, À 
transforma a base canônica (e1,...,en; CR" nabase(vy,...,vn) CE, 
logo é um isomorfismo entre R” e E. 

Noutras palavras, todo espaço vetorial de dimensão n é isomorfo 
a R”, 

Como o inverso A !:E > R" eo produto BA !:E —»Fde A por 
outro isomorfismo B: R” — F são isomorfismos, segue-se que dois 
espaços vetoriais E, F, ambos de dimensão n, são isomorfos. 
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Exemplo 6.8. O espaço Ph, dos polinômios de grau < n, tem di- 
mensão n+1, logo é isomorfo a R"*!. Por sua vez, o espaço M(m xp), 
das matrizes m x p, é isomorfo a R”P, portanto P, é isomorfo a 
M(m x p) se, e somente se, n+1 =mp. 

A noção de isomorfismo entre espaços vetoriais é fundamental . 

Ela nos permite identificar, sob o ponto de vista da Álgebra Li- 
near, espaços vetoriais que se apresentam sob formas à primeira 
vista diferentes. Por exemplo, a correspondência (a,,...,0n) & ao + 
ax + --: + anx”, é um isomorfismo natural entre R'*! e P,, que 
desempenha papel relevante em Análise. 

Noutro exemplo, se dispusermos os elementos de uma matriz n x 
n em fileiras paralelas à sua diagonal principal, veremos que há um 


total de 
n(n+1) 


2 

elementos nesta diagonal ou acima dela. Colocando esses elementos 
numa linha, em ordem determinada, obtemos um vetor de R"t+1)/2, 
Se a matriz dada é simétrica, os elementos abaixo da diagonal não 
são necessários para determiná-la pois apenas repetem os demais. 
Este processo estabelece um isomorfismo entre o espaço vetorial 
S das matrizes simétricas n x n e o espaço euclidiano R"t+1)/2, 
o que nos permite concluir que dim S = n(n + 1)/2. Um isomor- 
fismo análogo (desprezando a diagonal principal que, neste caso, só 
contém zeros) mostra que as matrizes anti-simétricas n x n formam 
um espaço vetorial de dimensão n(n — 1)/2. 


n+(n-D+---+2+1= 


Teorema 6.6. (Teorema do Núcleo e da Imagem.) Sejam E, F 
espaços vetoriais de dimensão finita. Para toda transformação linear 
A: E > Ftem-se dim E = dim N'(A) + dim Zm(A). 


Demonstração: O teorema resulta imediatamente da seguinte 


afirmação mais precisa, que provaremos a seguir: se [Au1,..., Au) 
é uma base de Tm(A) e (v;,...,vg) é uma base de N(A) então 
(ur, ..., Up, V1,--., Vq) é uma base de E. 


Com efeito, em primeiro lugar, se tivermos 
mu + +ropup+Bivi + +Bavg = (*) 


então, aplicando o operador À a ambos os membros desta igualdade 
e lembrando que v;,...,vg pertencem ao núcleo de A, obtemos 


x Au +:--+ op Au, =0. 
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Como os vetores Auy,..., Aup são L.I., resulta daí que q; = --- 
&%p — O. Portanto a igualdade (*) se reduz a 


Como v,...,vg são L.I., concluímos que B; — ---. — Bg — O. Isto 
mostra que os vetores uj,...,Up, V1,..., Vq São L.I.. 

Em seguida, consideremos um vetor arbitrário w Ee E. Como 
Aw € Zm(A), podemos escrever 


Aw = « Au +: +op Au, 


pois (Auy,..., Aup) é uma base da imagem de A. À igualdade acima 
pode ser reescrita como 


Alw— (yu + +++ %pUp)] = 0. 


Assim, o vetor w — (ju +--: + «pu,) pertence ao núcleo de A, logo 
pode ser expresso como combinação linear dos elementos da base 
tvi,..., Vq). Temos então 


w— (qu +---+opup)=Bivi+:-+Bava» 
ou seja, w = «ju + -:-+opup + Bivi +--: + Bavg - Isto mostra que 


os vetores u1,..., Up, V1,..., Va geram E e portanto constituem uma 
base. 














Corolário. Sejam E, F espaços vetoriais de mesma dimensão finita 
n. Uma transformação linear A: E — Fé injetiva se, e somente se, é 
sobrejetiva e portanto é um isomorfismo. 

Com efeito, temos n = dim N'(A) + dim Zm(A). Logo N(A) = (0) 
se, e somente se dim Zm(A) =n, ou seja, Im(A) = F. 














Exemplo 6.9. Um caso particular do corolário acima diz que, num 
espaço vetorial de dimensão finita, um operador linear é injetivo se, 
e somente se, é sobrejetivo. Isto seria falso num espaço de dimensão 
infinita, como se vê no seguinte exemplo: sejam A,B: Rº — RD 
definidos por 

A(xi 9X, X3, +» a) = (0, X1,X2,X3,-- a) 


B(x1,x2,X3, .. .) — (X2, X3, X4 . ais 


Seção 6 Núcleo e Imagem 67 


A e B são operadores lineares. O primeiro é injetivo mas não é so- 
brejetivo e o segundo é sobrejetivo mas não é injetivo. 


Exemplo 6.10. O Teorema do Núcleo e da Imagem dá outra expli- 
cação para o fato de um hiperplano H c R” ter dimensão n — 1. Por 
esse teorema, se dm E =n ef: E > R é um funcional linear O 
então o núcleo de f é um subespaço vetorial de dimensão n — 1 em E, 
pois f não-nulo implica Zm(f) = R logo dim Zm(f) = 1 e dim N'(f) = 
dim E — dim Zm(f) =n — 1. Ora, o hiperplano 


H=((x,..,xn) ECRM ax ++ mm O 
é o núcleo do funcional linear não nulo f: R” > R, definido por 


T(x1,..55Xn) = 0X ++ QXn- 


Teorema 6.7. Se uma transformação linear A: E > F tem uma 
inversa à esquerda B: F > E e uma inversa à direita C: F > E então 
B=CeAéum isomorfismo, com A!=B=C. 


Demonstração: Tem-se BA = Ip e AC = Ir. Portanto B = Blr = 
B(AC) =(BAJC=IC=C. 














Corolário. Seja dim E = dim F. Se as transformações lineares 
A:ESEFB:F>Esãotais que BA =Ipentão AB=IpeB=A”!. 
Com efeito, BA = IE > A injetiva > A sobrejetiva (Corolário 
do Teorema 6.6) => AC = Ir para alguma € > C = B (Teor. 6.7) 
> AB - Ir. 














Exercícios 
6.1. Prove que o núcleo e a imagem de uma transformação linear 
A: E — F são respectivamente subespaços vetoriais de E e F. 


6.2. Seja A: E — E um operador linear. Para quaisquer vetores 
ucN(A)eveZm(A), prove que setem Auce N(A) e Ave Tm(A). 


6.3. Encontre números a, b, c, d de modo que o operador A: R? > R?, 
dado por A(x,y) = (ax+by, cx+dy) tenha como núcleo a reta y = 3x. 
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6.4. Ache a, b, c, d tais que o operador A: R? — Rº com A(x,y) — 
(ax + by, cx + dy), tenha a reta y = 2x como imagem. 


6.5. Escreva a expressão de um operador A: R? — Rº cujo núcleo 
seja a reta y = x e cuja imagem seja a reta y — 2x. 


6.6. Defina um operador A: R? — R? que tenha como núcleo e como 
imagem o eixo x. 


6.7. Resolva um exercício análogo ao anterior, com a reta y = 5x em 
lugar do eixo x. 


6.8. Considere a transformação linear A: R$ — Rº, dada por 





Alxyzt)=(xty+rz+2t,x—u+2z,4x + 2y + 5z+ 6t), 


encontre um vetor b € Rº que não pertença à imagem de A e com 
isso exiba um sistema linear de três equações com quatro incógnitas 
sem solução. 


6.9. Seja E = Cº(R) o espaço das funções contínuas f: R — R. Defina 
o operador linear A: E — E pondo, para cada f E E, Af = q, onde 
p(x) = Jo f(t) dt, x E R. Determine o núcleo e a imagem do opera- 
dor A. 


6.10. Seja E = Rº o espaço vetorial cujos elementos são as se- 
quências x = (x1,x2,...) de números reais. Defina os operadores 
lineares A,B: E —> E pondo Ax = (x1,0,x2,0,x3,...) e Bx = y, onde 
y = (y»y2,...), ondey, = xx+1—2xk . Determine o núcleo e a imagem 
de AeB. 


6.11. Assinale verdadeiro (V) ou falso (F): 


( ) Uma transformação linear A: ESF é sobrejetiva se, e somente 
se, dim N'(A) = dim E — dim F. 


( ) Dada a transformação linear A: E > F, para todo b fixado em 
F, o conjunto G = (x € E; Ax = b) é um subespaço vetorial de E. 


( ) Para todo operador linear A: E > E, tem-se E = N(A) OZmaA. 


(. ) Todo operador linear injetivo no espaço Cº(R) das funções con- 
tínuas f: R > R é também sobrejetivo. 
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( ) O núcleo de toda transformação linear A:Rº — Rº tem di- 
mensão > 3. 


6.12. Seja a = [a;] uma matriz m x n. Se suas colunas geram um 

subespaço vetorial F, de dimensão r, em R” prove que, para todo 
n 

b E F, as soluções x = (x1,...,Xn) do sistema linear x ax; =b; (i= 
J= 

1,...,m) formam uma variedade afim de dimensão n — r em R?. 


6.13. Prove que cada uma das transformações lineares abaixo é inje- 
tiva e obtenha uma inversa à esquerda linear para cada uma delas. 


(a) A:R SR"; A(x) = (x,2x,...,nx). 


(b) B:R? 5 Rº;B(x,y) = (x+2y,x+y,x—u). 








(co) D:Rº = Rº; D(x,y,2z) = (2x,3u,5z,x + uy + 2). 


(d) C: Pr 5 Prç2; Co plx) = (x + Dp(x). 


6.14. Seja E um espaço vetorial de dimensão finita. Dado um opera- 
dor linear A: E > E, defina o novo operador Ta: L(E) > L(E) pondo 
Ta(X) = AX, para todo X e L(E). Prove que Ta é invertível se, e 
somente se, À é invertível. Mesmo problema para Sa(X) = XA. 


6.15. Sejam F,, F; subespaços de E tais que dim Fj+dim F = dim E. 
Mostre que existe um operador linear A: E >Etal que - N(A) e 
Ff = Zm(A). 


6.16. Prove que uma transformação linear A: E > F é sobrejetiva 
se, e somente se, transforma um conjunto de geradores de E num 
conjunto de geradores de F. 


6.17. Seja A:R? — R? um operador linear 2 0. Se A” = 0 para 
algum n > 2, prove que A? = 0. [Sugestão: seja F= ZmA. Então a 
restrição de À à reta F é zero ou é invertível.] 


6.18. Seja A: P, — P, o operador linear definido por A - p(x) = 
x- p”(x). Descreva o núcleo e a imagem de A. Obtenha bases para 
N(A) e para Zm(A). 
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6.19. Assinale verdadeiro (V) ou falso (F): 


( ) Se a transformação linear A: R” > R” é injetiva então 
dimZm(A) =m. 


( ) SeA:R”" — R” é sobrejetiva então dm N(A) =m—n. 


( )SeA,B e Z(R?) são tais que dim Zm(A) = dim Zm(B) então 
dim Zm(AB) = dim Zm(BA) = dim Zm(A). 


( ) Se (A) é gerado pelos vetores vy, vz, v; então a imagem do 
operador A: Rº — Rº tem dimensão 2. 


6.20. Determine uma base para a imagem de cada uma das trans- 
formações lineares abaixo e indique quais são sobrejetivas. 


(a) ALR? SRº, Alx,y) = (x—y;x—uy). 





(b) BER SR, Blxyzt)=(xHyz+tx+zy+t). 























(e) C:Rê => Rê, Clx,y,2) = (x+ ut 2+5). 
(d) D:M(2x2)> M(2x 2), D-.X= AX, onde À = o a 
(e) E: Pa > Pr, E-cplx) =x-p(x). 


6.21. Prove que as transformações lineares a seguir são sobrejetivas 
e obtenha uma inversa à direita linear para cada uma delas. 


(a) A:RÊ 5 R?, A(x,y,2) = (2x +y,2). 





(b) B:P.5R,B-p(x)=p(I). 





(ce) CIR? > RÊ, Clx,y) = (x +y,x—y). 














(d) PER SRP Plxi cassa) E (Xica Kano). 


Mostre que em três dos quatro exemplos acima, as transforma- 
ções dadas admitem infinitas inversas à direita lineares e infinitas 


não-lineares. 
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6.22. Para cada uma das nove transformações lineares dos exerci- 
cios anteriores, determine o núcleo e obtenha uma base do mesmo, 
caso não se reduza a (0). 


6.23. Seja T:P, > Ph o operador linear definido por Tp(x) = 
5p(x) — 4p'(x) + p”(x). Mostre que seu núcleo é (0; e conclua que, 
para todo polinômio b(x) existe um polinômio p(x) tal que 5p(x) — 
4p' (0) + p”(x) = b(x). 


6.24. Seja X c F um subconjunto com a seguinte propriedade: toda 
transformação linear A: E — F cuja imagem contém X é sobrejetiva. 
Prove que X é um conjunto de geradores de F. 
(Sugestão: é muito mais fácil do que parece.) 


6.25. Seja A: E — F uma transformação linear sobrejetiva entre 
espaços vetoriais de dimensão finita. Prove que existe um subespaço 
vetorial E” c E tal que a restrição de À a E” é um isomorfismo 
sobre F. 


6.26. Seja A: E > F um isomorfismo. Se T:F >» E é tal que AT = IF 
(ou TA = Ig), prove que T é linear. 


6.27. Sejam E, F espaços vetoriais de dimensão finita. Se dim E < 
dim F, prove que existem transformações lineares A:E > Fe 
B: F> E tais que À é injetiva e B é sobrejetiva. 


6.28. Dadas as transformações lineares A: E > F, B:F > G, assi- 
nale V(erdadeiro) ou F(also) nas seguintes implicações: 


( )BA sobrejetiva > B sobrejetiva. 

( )BA sobrejetiva > A sobrejetiva. 

( )BA injetiva > B injetiva. 

( ) BA injetiva > A injetiva. 

Prove ainda que se E = F = G então as quatro implicações são 
verdadeiras. 


6.29. Prove que toda transformação linear A pode escrever-se como o 
produto A = TS, onde S é uma transformação linear sobrejetiva e T é 
uma transformação linear injetiva. Vale também uma decomposição 
do tipo À = S'T', com S' sobrejetiva e T' injetiva? 


6.30. Dado o conjunto finito X com n elementos, prove que o espaço 
vetorial F(X;R) é isomorfo a R”. Mais geralmente, dado qualquer 
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espaço vetorial E, estabeleça um isomorfismo entre F(X;E) e E” = 
Ex-..xE(n fatores). 


6.31. Dados os números reaisa = a <a) <--:< an =, considere 
o conjunto E; C F(la,b];R) formado pelas funções f: [a,b] > R que, 
em cada intervalo fechado [a; 1,ai;l, 1 = 1,...,n, são representadas 
por polinômios de grau < 1, isto é, f(x) = «x + Bi; para a) <x < 
ai. Prove que E, é um subespaço vetorial e que a correspondência 
fr (f(ao),...,f(an)) é um isomorfismo entre E; e R?*!. Conclua 
que dim E; =n +41. Descreva a base de E; que corresponde à base 
canônica de R?*1. 


6.32. Com a notação de exercício anterior, seja E; o conjunto das 
funções deriváveis f: la,b] — R cujas restrições aos intervalos 
la1,ai;], 1 = 1,...,n, são polinômios de grau < 2. Considerando 
a derivação D: E; — E, prove que E; € F(la,b];R) é um subespaço 
vetorial de dimensão n + 2. 


6.33. Sejam E um espaço vetorial de dimensão finita, E* = L(E;R) 
seu dual e E** = Z(E*:R) seu bi-dual. Considere a correspondência 
é: E > E*, que associa a cada vetor v E E o elemento E(v) = v** E E* 
tal que v**(f) = f(v) para todo v E E. Prove que £ é um isomorfismo. 
[Este exercício significa que f(v) pode ser considerado como um valor 
da função f de variável v ou da função v (mais exatamente, v**) de 
variável f.] 


6.34. Seja f: E > R um funcional linear não-nulo no espaço vetorial 
E, de dimensão n. Prove que existe uma base (u,,...,un! € E tal 
que f(u,) =---.= f(un 1) = 0 e f(un) = 1. Use este fato para provar 
que se g: E > R é outro funcional linear não-nulo então existe um 
isomorfismo A: E > Etal queg =foA. 


6.35. Dado o funcional linear não-nulo f: E > R, prove que existe 
um vetor u € E tal que f(u) = 1. Seja F c E o subespaço (reta) gerado 
por u. Prove que E = Fo N(f). 


6.36. Sejam f,g: E > R funcionais lineares não-nulos no espaço 
vetorial E, de dimensão finita. Prove que um deles é múltiplo do 
outro se, e somente se, eles têm o mesmo núcleo. 


6.37. Supondo Y Cc X, descreva o núcleo e a imagem da transfor- 
mação linear R: F(X;R)>F(Y;R), que associa a cada função f: X>R 
sua restrição Rf= flY: Y5R. 
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6.38. Sejam E, F os espaços vetoriais cujos elementos são respecti- 
vamente as funções pares e as funções ímpares R > R. Descreva o 
núcleo e a imagem das transformações lineares R: E — F([0, +oo);R) 
e R':F > F([0,+00);R) que associam a cada função f:R > R sua 
restrição ao intervalo [0, +oo). 


6.39. Estabeleça um isomorfismo entre o espaço vetorial das matri- 
zes simétricas n x n e o espaço das matrizes triangulares inferiores 
(a; = O sei <j). Idem entre as matrizes anti-simétricas e as trian- 
gulares inferiores com diagonal nula. 


6.40. Sejam Fy e F; subespaços vetoriais de dimensão 3 em Rº. Quais 
são as dimensões possíveis do subespaço F NF;? Mesma pergunta 
com dim F = 4e dim F =3. 


6.41. Seja A: E — E um operador linear. Prove que A? = 0 se, e 
somente se, Tm(A) C N'(A). 


6.42. Dadas as transformações lineares A,B: E > F, entre espaços 
vetoriais de dimensão finita, prove: 


(a) Se N(A) = N'(B) então existe um isomorfismo Q: F > Ftal que 
B=QA. 
(b) Se Zm(A) = Zm(B) então existe um isomorfismo P: E > E tal que 
B = AP. 


(c) Se dim N'(A) = dim N'(B) (ou, equivalentemente, dim Zm(A) = 
dim Zm(B)) então existem isomorfismos P:E > Ee Q:F > Ftais 
que B = QAP. 

(d) Existem operadores lineares A,B: E — E tais que N(A)=N'(B), 
Im(A) = Zm(B), sem que exista um isomorfismo P: E — E, com 
B=PAAR. 


6.43. Se os vetores vj,...,vm € E geram um subespaço vetorial de 
dimensão r, prove que o conjunto dos vetores (a1,...,âm) € RM 
tais que ayvi + --- + amvm = O é um subespaço vetorial de R” 
com dimensão m — r. [Sugestão: considere a transformação linear 
(01,..., Gm) + oyvi +: + amvm, de R” em E.) 














6.44. Seja A: E — E um operador linear tal que A* = O para algum 
número natural k. Prove que, para todo « 0, o operador À — al é 
invertível. 
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6.45. Se, para algum « £ 0, tem-se «ol+qgAÃ+-:-+amA” = 0, 
prove que o operador linear À é invertível. 


6.46. Sem fazer hipóteses sobre as dimensões de E e F, sejam À: E > 
Fe B: F > E transformações lineares. Se AB é invertível, prove que 
A é sobrejetiva e B é injetiva. Se AB e BA são invertíveis, prove que 
A é invertível. 


6.47. Calcule (B-! AB)”. 


/ 


Soma Direta e Projeção 


Esta seção trata da decomposição de um espaço vetorial como soma 
de subespaços independentes, mostra que essa decomposição equivale 
a definir um operador idempotente no espaço e estabelece a conexão 
entre projeções e involuções, ou simetrias. 


Na Seção 2, vimos que se F; e F; são subespaços do espaço vetorial 
E, o subespaço vetorial de E gerado pela reunião F UF é o conjunto 
K + F de todas as somas u+v, ondeu e Fev e 6. No caso 
particular em que F NF; = (0), escreve-se F; €& É em vez de F, + F, 
diz-se que H & F é a soma direta de F com F; e prova-se (Teorema 
2.1) que a condição F; NF; = (0) equivale a dizer que u + v=u +v, 
comu cFrev,v ef, implicau=uev=V. 

Existe uma noção análoga à de soma direta, que é o produto car- 
tesiano E, x E; de dois espaços vetoriais E, e E5. Aqui E, e E, não 
precisam ser subespaços vetoriais do mesmo espaço E. Os elemen- 
tos do conjunto E; x E; são os pares ordenados (u,v), onde u E E; 
ev € E. As operações que tornam E, x E; um espaço vetorial são 
definidas por 


(u,v) E (u”,v) - (u+u,v+v), o(u,v) E (ou, av), 


para quaisquer u,u' E E, vv E E ea E R. O vetor nulo de 
E, x E; é o par (0,0) e o inverso aditivo de (u,v) é (—-u,—v). Se 
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(tuy,.. Um) C Ey e lvs,...,vn) C E; são bases, é imediato consta- 
tar que ((11,0),...,(Um,0), (0,v1),...,(0,vn)) C Ey x E; é uma base, 
de modo que dim(E; x E;) = dim E, + dim Es. 

Se F e F; são subespaços vetoriais de E, com F; NF; = (0), então 
a transformação linear 


A: FH xb5o He k, 


definida por A(u,v) = u+v, u € E, v € É, é um isomorfismo, 
como se verifica facilmente. Se (u,...,umb)CHelvi,..svn) CF 
são bases então a base ((u1,0),..., (Um,0), (0,v1),... (0,vn)) de F x E 
é transformada por A no conjunto (w,...,Um,V1,-..,Vn) O qual é, 
por conseguinte, uma base de F & F,. Segue-se que dim(F, & 5) = 
dim H+dim b=>m+n. 

No caso mais geral, em que a interseção F; MN F; dos dois subes- 
paços H,F, C E não se reduz necessariamente ao vetor nulo, a soma 
H + F pode não ser uma soma direta mas, mesmo assim, está bem 
definida a transformação linear 


A: H x Ff —s H +, 


onde A(u,v) =u+vparau € Fev e F. Obviamente, À é sobreje- 
tiva. Seu núcleo é formado pelos pares (u,v) tais que u + v = 0, isto 
é,v=-u, logo u e v pertencem ambos a F; e a E. Noutras palavras, 
N(A) = ((u,-u);u € H N 5). A correspondência us (u, —u) é um 
isomorfismo evidente entre F;N F; e (A). Pelo Teorema do Núcleo 
e da Imagem, temos 


dim K + dim É = dim(F, x É) 


= dim N(A) + dim(F, + 5) 
= dim(H NF) + dim(F + ). 


Isto nos permite enunciar o 
Teorema 7.1. Sejam F; e F; subespaços de dimensão finita de um 
espaço vetorial E. Tem-se dim k + dim É = dim(F, NH) + 
dim(F, + F5). 

A noção de soma direta está intimamente ligada à noção de pro- 
Jeção. Se E = H &F é a decomposição do espaço vetorial E como soma 
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direta dos subespaços F e F;, define-se o operador linear P:E 5 E, 
projeção de E sobre Fi, paralelamente a F>, do seguinte modo: todo 
vetor w E E se escreve, de modo único, como soma w = u+v de 
um vetor u € F, com um vetor v E F,. Põe-se então Pw = u. (Veja 
Fig. 7.1.) 


HF 








Figura 7.1. 


O operador linear P:E > E assim definido tem imagem F e 
núcleo F;. Além disso, como se vê facilmente, P é idempotente, isto 
é, P? = P. O teorema seguinte mostra que, reciprocamente, todo 
operador linear idempotente é uma projeção. 

Preliminarmente, observemos que se P? = P então, para todo 
w € Zm(P), tem-se Pwy = w pois w E Zm(P) w = Pv Pw 
PPy=Py=u. 








Teorema 7.2. Seja P: E — E um operador linear. Se P? = P então 
E é a soma direta do núcleo com a imagem de P. Além disso, Pé a 
projeção sobre Tm(P) paralelamente a N' (P). 


Demonstração: Todo v € E escreve-se como soma v = (v — Pv) + Py, 
onde Pv, evidentemente, pertence a Zm(P) e, como P(v — Pv) = Pv — 
PPv = Pv— Pv = 0, vemos que v — Pv e N'(P). Portanto E = N'(P) + 
Im(P). Sew e N(P) NZm(P), por um lado tem-se Pw = 0 e, por 
outro, Pw = w; logo w = 0. Assim N'(P) NZm(P) = (0) e tem-se a 
soma direta E = N(P) & Zm(P). A última afirmação do enunciado é 
óbvia. 
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Exemplo 7.1. Para todo operador linear A: E — E num espaço 
vetorial de dimensão finita vale a relação dim E = dim N(A) + 
dim Zm(A). Isto porém não implica que se tenha sempre E = N(AJ& 
Im(A). Por exemplo, se A:R? — Rº é definido por A(x,y) = 
(x—y,x—uy) então, tomando w = (1,1), temos w = Av, com v = (2,1) 
e Aw =0, logo N(A) NZm(A) contém o vetor não-nulo w. 

Outro exemplo de operador linear que está ligado à decomposição 
de um espaço vetorial como soma direta de dois subespaços é forne- 
cido pelas involuções. 

Uma involução é um operador linear S: E » Etal que S? = I, ou 
seja, S(Sv) = v para todo v E E. 

Noutras palavras, uma involução é um operador invertível, igual 
ao seu próprio inverso. Um exemplo de involução é a reflexão (orto- 
gonal) no plano em torno de uma reta que passa pela origem. 

Veremos agora que toda involução é a reflexão em torno de um 
subespaço, paralelamente a outro. 


Teorema 7.3. Seja S: E — E uma involução. Os conjuntos F| = 
tu e ESu=uteFf, = [ve ESv = —vi são subespaços vetoriais e 
E=hHerk. Paratodow =u+v, comueHeve Etem-seSw = u—v. 
Além disso, P = 5(s + 1) é a projeção sobre Fy, paralelamente a Fh. 
(Veja Fig. 7.2.) 
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Demonstração: Para todo w € E, podemos escrever w = u+v, onde 
u=(w+Sw)/2 ev = (w- Sw)/2. Como S? = I, é claro que Su =u e 
Sv=-v,ouseja,uEehHeve F. É claro também que Ff nf =(0je 
quew=u+v>Sw=u-vseuef, eve F. Finalmente, 


P=5(S+)5Pl=4(82+25+]) 


(28 +21) 


Nnia pia pa 


(S+D=pP. 











Vê-se facilmente que o núcleo de P é F; e a imagem de P é F. 





Na situação descrita pelo Teorema 7.3, diz-se que a involução S é 
a reflexão em torno do subespaço F;, paralelamente a F,. O caso mais 
comum de reflexão é aquele em que se tem dim E =n, dim F, =n—1 
e dim F, = 1, de modo que S é a reflexão em torno do hiperplano F; 
paralelamente à reta F5. 


Exercícios 


7.1. No plano Rº, considere as retas F; e F5, definidas respectiva- 
mente pelas equações y = ax ey = bx, com a Z b. Em seguida: 


(1) Exprima cada vetor v = (x,y) E R? como soma de um vetor em 
HF, e um vetor em F. 


(2) Obtenha a matriz (em relação à base canônica) da projeção 
P:R? > R?, que tem F; como núcleo e F; como imagem. 


(3) Ache a matriz da reflexão S: R? — R?, em torno da reta F, 
paralelamente a F,. 


7.2. SeP, Q: E > E são projeções e PQ = QP, prove que PQ é uma 
projeção cujo núcleo é N'(P) + N'(Q) e cuja imagem é Zm(P)NZm(Q). 
7.3. Exprima um vetor arbitrário v = (x,y,Zz) € Rº como soma de um 
vetor do plano H, cuja equação é x+y — z = 0, com um vetor da reta 
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É, gerada pelo vetor (1,2,1). Conclua que Rº = H & F,. Determine 
a matriz (relativa à base canônica) da projeção P: Rê — Rº, que tem 
imagem F, e núcleo F,. 


7.4. É dado um operador linear P: E — E. Assinale verdadeiro (V) 
ou falso (F): 


( ) SeE=N(P) & Zm(P) então P é uma projeção. 

( ) SeE=N(P) +Zm(P) então P é uma projeção. 

( ) Se P é uma projeção então I — P também é. 

( ) Se P é uma projeção então Zm(P) = N(I— P) e N(P) = 


Im(I-—P). 


7.5. Se N(P) = Zm(I — P), prove que o operador linear P: E > E é 
uma projeção. 

b 

d 


0 
0 
é a matriz (na base canônica) de uma projeção P: Ré — Rº. Escreva 
as equações que definem o núcleo e a imagem dessa projeção. 


7.6. Mostre que 


Som 
So040 
Soo e 


0 


7.7. Prove que o operador P: Rê? — R?, dado por P(x,y) = (—-2x — 
4y, 5x + 3y) é a projeção sobre uma reta. Determine o núcleo e a 
imagem de P. 


7.8. Considere o operador linear A: Ré — Rº, dado por 





Al(x,y,Z) = (40x + 18y — 6z, 18x + 13y + 12z, —6x + 12y + 452). 


Mostre que P = 3 - À é uma projeção, que Zm(P) é um plano e 
determine a equação desse plano. 


7.9. Sejam Fy, F; subespaços vetoriais de E, com dim F, + dim F; = 
dim E (dimensões finitas). Prove que E = H & É se, e somente se, 
Hnkf = TO). 
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7.10. Seja A: E — E um operador linear num espaço vetorial de 
dimensão finita. Prove que E = N(A) & Zm(A) se, e somente se, 


N(A) = N(A?). 


7.11. Suponha que o espaço vetorial de dimensão finita E admita 
a decomposição E = F, & --: & F., como soma direta de subespaços 
vetoriais. (Vide Exercício 2.33.) Para cada i = 1,...,k, escreva G; = 
HKHe-- eh 4€Fw &---€F, e chame de P;: E > E a projeção sobre 
F;, paralelamente a G;. Prove que Pj+---+P, Ie P;P; -OseiZj. 


7.12. Sejam P,,...,P;: E — E operadores lineares tais que 
Pp+--:+Pp = IePP — 0sei £j5. Prove que esses operadores 
são projeções. 


7.13. Sejam P,Q: E 5 E projeções. Prove que as seguintes afirma- 
ções são equivalentes: 
(a) P+ Q é uma projeção; 
(b) PQ+QP=0; 
to) PQ=QP=0 
[Para provar que (b) > (ce), multiplique à esquerda, e depois à 
direita, por P.] 


7.14. Prove que o produto de duas involuções é uma involução se, e 
somente se, elas comutam. 


7.15. Mostre que os seguintes operadores são involuções e 
determine, em cada caso, a projeção correspondente na forma do 
Teorema 7.8. 


(a) S: F(RZ;R) > F(RZ;R), Sf = f*, f(x,y) == fue: 
(b) U: F(R$:R)5S F(R*;R), Ur = £ flo) = T(1/x). 





(0) VIRPSROV(x,...xn) = (>X1,...05—Xko Xktlo 0009 Xn). 


7.16. Se o espaço vetorial E tem dimensão finita, prove que para 
todo subespaço F C E existe (pelo menos) um subespaço G C E tal 
que E -F&O 6. 
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7.17. Seja E = HH & 6. O gráfico de uma transformação linear 
A: F; > É é o subconjunto G c E formado pelas somas v + Av, onde 
v € F. Prove que G é um subespaço vetorial de E e que a projeção 
P: E > F, restrita a G, define um isomorfismo entre G e Fj. Recipro- 
camente, se G € E é um subespaço vetorial tal que a restrição de P 
a G é um isomorfismo de G sobre F;, prove que G é o gráfico de uma 
transformação linear A: F > Fh. 


7.18. Diz-se que XUY = Z é uma partição de Z quando XNY = |. Se 
JUK =(1,...,n) é uma partição, prove que R” — RJ & K*, onde RJ e 
RÉ são os subespaços vetoriais de R” gerados pelos vetores EnTEJe 
pelos vetores ex, k € K respectivamente. Seja F c R” um subespaço 
vetorial. Prove que existe uma partição JUK = (1,...,n) tal que F 
é o gráfico de uma transformação linear A: RJ — KKK, onde dim F = 
número de elementos de J. 














7.19. Seja P: E — E uma projeção. Prove que os vetores ve (1 —t)v+ 
tPv, para todo ve E etodot E R, têm a mesma imagem por P. 


7.20. Sejam P, Q: E > E projeções. Se P + Q for ainda uma projeção, 
prove que Im(P + Q) = Im(P) & Im(Q). Considerando as projeções 
P,Q: R? > Rº, com P(x,y) = (x,0) e Q(x,y) = 5(x+y,x +y), mostre 
que a recíproca é falsa. 


7.21. Prove que todo espaço vetorial de dimensão finita é soma di- 
reta de subespaços de dimensão 1. 


8 


A Matriz de uma 


Transformação Linear 


A matriz de uma transformação linear é um objeto concreto, asso- 
ciado a essa transformação na presença de bases em seu domínio e 
seu contra-domínio. A matriz permite obter uma variedade ilimi- 
tada de exemplos de transformações lineares, bem como calcular es- 
pecificamente a imagem de um dado vetor por uma transformação. 
Nesta seção será estudada a relação entre uma transformação linear 
e sua matriz. Em particular, o produto de transformações conduzirá 
a uma profícua noção de produto de matrizes. Veremos como se re- 
lacionam as matrizes da mesma transformação tomadas em bases 
diferentes e daremos uma demonstração direta da igualdade entre o 
posto-linha e o posto-coluna de uma matriz. 


Vimos na Seção 4 que uma transformação linear A:R” > RM 
fica inteiramente determinada pela matriz a = la;l € M(mxn), cujo 
ij-ésimo termo ai; é a i-ésima coordenada do vetor À - e; E R”. Com 
efeito, conhecendo essa matriz tem-se, para cada v = (x1,...,Xn) E 
R”,o valor À -«v = (yj,...,Um) dado por 


Ui = Ma ++ dada (Ls cs m). 


Estenderemos agora essas considerações a uma transformação li- 

near entre dois quaisquer espaços vetoriais de dimensão finita. 
Sejam E, F espaços vetoriais de dimensão finita e A: E > F uma 

transformação linear. Fixadas bases V = (vy,.. vn) CEeW = 
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(w1,...,Wm) C F, para cada j = 1,...,n 0 vetor Av; se exprime como 
combinação linear dos vetores da base VW: 


m 
Av; = UjW1 + Qo;w2 +: + AmjWm = ba CijWi. 


i=1 


Assim, a transformação linear A: E — F juntamente com as bases 
VctEtew c Fdeterminam uma matriz a = la;]) e M(mxnm), 
chamada a matriz de A relativamente a essas bases (ou nas bases 
V,W). 

Por definição, a j-ésima coluna da matriz a é formada pelas coor- 
denadas de Av; em relação à base VV. 

Embora isso não seja mencionado explicitamente, convém salien- 
tar que os vetores nas bases V e W são dispostos numa ordem fixa, 
sem o que a matriz a não ficaria bem definida. 

No caso em que A: E — E é um operador linear, a menos que seja 
feita menção explícita em contrário, considera-se apenas uma base 
V=Ivi,...,vn] C Ee a matriz a = [a;] do operador À relativamente 
à base V (ou na base V) é definida pelas n igualdades 


n 
Ay=> avi (1-1 sol) é 
i=] 


Neste caso, a € M(n x n) é a matriz quadrada n x n cuja j-ésima 
coluna é formada pelas coordenadas do vetor 


Av; = WjVi + GoV2 +: + QnjVn 


na base V. 

Quando considerarmos uma transformação linear A: R” > RM 
e dissermos apenas a matriz de A, estaremos significando a matriz 
de A relativamente às bases canônicas de R” e R”. Caso utilizemos 
outras bases, isto será dito explicitamente. 


Exemplo 8.1. Consideremos um espaço vetorial E, de dimensão 
finita. Dado « E R, seja A: E — E o operador linear definido por Av = 
av para todo v E E. Relativamente a qualquer base V = (vy,...,vn) E 
E, a matriz a do operador A é sempre a mesma, com números « na 
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diagonal e zeros fora dela: 


a O. 0 

0 aq 0 
a= 

O 0. «& 


O operador À = al é o que se chama uma homotetia de razão a. 
Estes são os únicos operadores cujas matrizes independem da base 
dada. (Vide Exercício 8.35.) 


Exemplo 8.2. Seja P: E > E a projeção sobre o subespaço F, pa- 
ralelamente ao subespaço F. Sejam ainda V, CF ey c F bases 
quaisquer desses subespaços. Então V = VU V, é uma base de E, 
relativamente à qual a matriz p de P tem os k primeiros termos da 
diagonal iguais a 1 (k = dim F;) e todos os demais termos (sobre a 
diagonal ou fora dela) iguais a zero. Analogamente, seS:E > Eéa 
reflexão em torno de F; paralelamente a F,, sua matriz s na base V 
tem os primeiros k termos da diagonal iguais a 1, os restantes iguais 
a —1 e todos os termos fora da diagonal iguais a zero. 

A fixação das bases V c Ee W c F determina portanto uma 
transformação 

pq: L(EF 5 M(m x mn), 


que faz corresponder a cada À E £L(E;F) sua matriz a nas bases V, 
W. A transformação q é linear, ou seja, se a,b e M(m x n) são 
as matrizes de A,B E £(E;F) respectivamente e «, 3 são números 
reais, então a matriz de A + Bé a+hb, a matriz de «A é «a e, mais 
geralmente, a matriz de «A + BB é «a + Bb. Mais ainda, q é um 
isomorfismo: a bijetividade de q é assegurada pelo Teorema 4.1. 

Convém observar que, no caso de E = Rº e F = R”, existe um 
par natural de bases (canônicas) nestes espaços, de modo que o iso- 
morfismo q: L(R";R”") > M(m xn) pode ser definido sem depender 
de escolhas arbitrárias. A cada transformação linear A:R”" — RM 
corresponde a matriz q(A) = [ai] cujo j-ésimo vetor-coluna é A - e; = 
(ar, Rosca Am). 

Em particular, a cada funcional linear f: R" — R corresponde, 
de modo natural, uma matriz [01,...,an) E M(lI x mn) ou, o que é 
o mesmo, um vetor (a,..., an). As correspondências entre a ma- 
triz [01,...,an] e o funcional f tal que f(e;) = a;, e entre fe o vetor 
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(a1,..., On), São isomorfismos entre M(1 x n), (R")* e R”, determi- 
nados pela base canônica de R?, 

Entre transformações lineares, além das operações A+ Be «A, 
existe também a multiplicação BA. O isomorfismo q faz correspon- 
der ao produto BA o produto ba das matrizes de B e de A, segundo 
definiremos a seguir. 

Sejam u = (w,...,an) ev = (By,...,Bn) vetores em R”, O pro- 
duto interno de u por v é definido como o número 


(u,v) =ciBr +: +onBn. 


A noção geral de produto interno, suas propriedades e aplicações 
serão estudadas na Seção 10. Um caso particular será usado agora 
para introduzir o produto de duas matrizes. 

Sejam b — [b;l ce M(mxn)ea — [a;] ce M(n x p) matrizes 
tais que o número de colunas de b é igual ao número de linhas de 
a. O produto da matriz b pela matriz a (nesta ordem) é a matriz 
ba = c = lci;]e M(m x 7), cujo ij-ésimo elemento 


n 
Cj = bar + bpaz + --- + bina; = 3. bx ax; 
k=1 


é o produto interno do i-ésimo vetor-linha de b pelo j-ésimo vetor- 
coluna de a. 


Exemplo 8.3. Uma transformação linear A: R” — R” pode ser 
interpretada como uma multiplicação de matrizes: em vez de À € 
£L(R";R”) considera-se sua matriz a — la;] € M(m x n). Em par- 
ticular, os funcionais lineares f: R” — R são substituídos por ma- 
trizes 1 xn, ou seja, por vetores-linha. Além disso, os vetores x = 
(x1,..,Xn) ERP eb = (by,..., bm) passam a ser considerados como 
matrizesnx 1 emx1 respectivamente, ou seja, como vetores-coluna. 
Então a igualdade Ax = b passa a ser escrita sob a forma ax = b, 


an o am] |Xi bs 
a * am| |x2 bz 
Ami o Am Xn bm 


Dentro deste ponto de vista, a Álgebra Linear se reduz ao cálculo 
de matrizes, o que traz vantagens sob o aspecto computacional mas 
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o custo é a perda da intuição geométrica, da simplicidade conceitual, 
além da impossibilidade de se tratar o caso de dimensão infinita. 

A definição do produto de matrizes foi formulada de modo a tor- 
nar verdadeiro o teorema seguinte. Nele, A:E »FeB:F >» G são 
transformações lineares, U — (u,.. ,p) CE V=(vi,.. sv) CFe 
W = (wy,...,)Wm) E G são bases, a E M(n x p) é a matriz de À nas 
basesYu, Vebe M(mxn) é a matriz de B nas bases V, W. 


Teorema 8.1. A matriz de BA: E — G nas bases U, W é o produto 
ba e M(m x p) das matrizes b e a. 


Demonstração: Por definição, temos 


n 
Au; =5 av = 1,.0e, Pp) 
k= 


m 
Bv. => buwi (= aaa): 


i=l 


Seja ce — [cj] e M(m x p) a matriz de BA nas bases U, W. Por 
definição, para cada j = 1,...,p, temos: 


m n n 
a Cjwi — BAu; =B [> cn) — >. ak;Bvk = 
i=l k=1 k=1 
m n n m 
= >. Ok [> ba = >. > duas Wi. 
k=1 i=l i=1 "k=1 


Igualando os coeficientes de cada w;, concluímos que, para i=1,..,m 


ej=1,...,p, tem-se 
n 
Cij = s bica, 
k=1 











logo c = ba. 





Resulta imediatamente do teorema acima e do isomorfismo 
q: L(E;F) > M(m x n) que as regras operacionais do produto de 
transformações lineares se transferem diretamente para o produto 
de matrizes. No que se segue, indicaremos com o símbolo L, a matriz 
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identidade n x n. Tem-se In = [dj], onde d;; é o símbolo de Kronec- 
ker: dy — O sei £je dó = 1. Quando não houver ambigiiidade, 
escreveremos simplesmente I em vez de In. 

As propriedades abaixo listadas se provam considerando, para 
cada a € M(m x), a transformação linear A: R” — R” cuja matriz 
é a e aplicando a propriedade correspondente para transformações 
lineares, já provada anteriormente. 


1) (cb)a — c(ba); 

2) c(a+b) = ca+ cb; (b-+c)a = ba+ ca; 
3) a-l,-a, Inca-aseaeM(mxn); 
4) b(«a) = a(ba). 


Dada a e M(m x n), diz-se que x € M(n x m) é uma matriz 
inversa à esquerda de a quando xa = 1, e que y e M(n x m) é uma 
matriz inversa à direita de a quando ay = In. 


5) Uma matriz mxn possui inversa à esquerda se, e somente se, seus 
vetores-coluna são L.l. e uma inversa à direita se, e somente se, esses 
vetores-coluna geram RP. 

Uma matriz a chama-se invertível quando é quadrada e existe 
uma matriz a !, chamada a inversa dea,talquea la= aa !=I 


6) Se uma matriz a possui uma inversa à esquerda x e uma inversa 


à direita y então a é quadrada, éinvertivlex=y = a |. 


7) Uma matriz quadrada a admite uma inversa à esquerda se, e 
somente se, admite uma inversa à direita. Neste caso, a matriz a é 
invertível e cada uma dessas inversas laterais é igual a a”. 

À seguir, determinaremos como varia a matriz de uma transfor- 
mação linear A: E > F quando se mudam as bases em E e F. 

Sejam V = (vy,..svmm) CEeW =(wy,...,Wm) € F bases, em 
relação às quais a matriz da transformação linear A:E > Fé a = 
la;]e M(m x n). Isto significa que 


m 
Av=> aw; = 1. cen). 
i=1 


Tomando novas bases V = (vi,..,v])cCEeW =(wm,.. sw) CF, 


a transformação linear A tem nova matriz a” = [ai] e M(mxn), 
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definida por: 
m 
Av=> aw = Lsdaçiti (5) 


Para obter a relação entre as matrizes a e a”, consideramos as 
matrizes de passagem p = Ipyl e M(n xn)eq= Iqule M(mxm), 
definidas pelas igualdades 


n m 
/ 
= ) PijVk e W, = ) GirWi. 
k=1 i=] 


Por definição, p é a matriz de passagem da base V para a base V' e 
q é a matriz de passagem da base W para a base W”. Cada um dos 
dois membros da igualdade (*) pode ser escrito separadamente, em 
termos da base W, assim: 


n 
Ay = 2 Pi Am = 5 pis Do au 


=1 


a 


LR 


Pk; ix Wi 


i=] 


Ms Me 1 


AkPkj | Wi, 


OS 
TM. 


=1 


II 
NR 


m 
Tr) s» Guwi 


i=1 


MM 

E 

MM 
E 


j 
ur 
5 
Il 
E 


ME 
ME 


/ 
Ay Qir Wi 
! 
dir os Wi 
m 


n 
! 
Do AikPkj = pu Gird;» 
k=1 


r=1 


i=] 


Il 
pi 
a 
Il 


Me 
Ms 


1 


i Tr 


Igualando os coeficientes de w; vem: 


isto é, ap = qa”. 
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Observemos agora que toda matriz de passagem é invertível. 
Com efeito, se p é a matriz de passagem da base V para a base V 
então p é também a matriz (em relação à base V) do operador linear 
P:E > E, tal que Pv; = vj G =1,...,n), 0 qual é invertível porque 
leva uma base numa base. 

Assim, da igualdade ap = qa” podemos concluir 


a =q ap. 
Esta é a fórmula que nos dá a matriz a' de À nas bases V”, W' em 
função da matriz a de À nas bases V, W. No caso particular de um 


operador A: E — E e de suas matrizes a, a' relativas às bases V, V”, 
temos uma única matriz de passagem p, que nos dá 
a =p !ap. 

As duas matrizes quadradas a e p ! ap dizem-se semelhantes. 

Assim, as matrizes do mesmo operador em relação a bases diferentes 
são semelhantes. Vale também a recíproca: sea ea' =p !ap são 
matrizes n x n semelhantes então existe um operador A: R? » RM 
tal que a e a” são matrizes de A relativamente a bases distintas 
de R?. 
Com efeito, dadas a e à” = p!ap, consideramos o operador 
A:R” > Rº cuja matriz na base canônica E de R”º é a. Em seguida, 
consideramos a base €' € R”, obtida da base canônica pela matriz 
de passagem p. Então a' é a matriz de À na base €”. 





Para efeitos práticos é útil observar que se V = (vi,...,vn) é uma 
base em R” então a matriz de passagem da base canônica para V é 
aquela cujas n colunas são os vetores vy,...,Vn. 


Exemplo 8.4. Seja A:R? — R? o operador linear que consiste na 
reflexão em torno da reta y = ax. Como se viu no Exemplo 4.4, a 
matriz de A relativamente à base canônica de R? é 





























I-a2 2a 
l+a? Ira? 
a 
2a a2—] 
l+a? 4a? 
Seja V = fvi,vz) EC Rº a base formada pelos vetores vi = (1,a) e 
vz = (—a,1). Para todo vetor v = (x,y) € R?, temos 
dixái= E 2a 2a ga 
13 1+a? Treo Tra Tara 
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logo Av; = vi e Avz = —v2. (De resto, estas igualdades são geometri- 
camente óbvias.) Portanto a matriz de À na base V é 


ao 
> Tó =] 


A matriz de passagem da base canônica de Rº para a base V é 


p=[a 


Segue-se quea' =p !.a-p. Neste caso, foi mais simples calcular a” 
diretamente do que determinar p”! e efetuar a multiplicação p !ap. 
(Observação: p! = Ta o 7 ) 

Seja A: E — F uma transformação linear entre espaços vetori- 
ais de dimensão finita. O posto de À é a dimensão da sua imagem. 
Evidentemente, dim Zm(A) < dim F. Além disso, pelo Teorema do 
Núcleo e da Imagem, dim Zm(A) < dim E. Segue-se que o posto de 
A não excede dim E nem dim F. O posto de À é igual à dimensão 
de E se, e somente se, À é injetiva. E é igual à dimensão de F se, e 
somente se, À é sobrejetiva. 

Se ae M(m xn) é a matriz de À relativamente a um par qual- 
quer de bases YU Cc E,V C F,o posto de À é a dimensão do subespaço 
de R” gerado pelas colunas de a. Logo, o posto de À é o número 
máximo de colunas linearmente independentes da matriz a. 

Esta observação nos leva a definir o posto segundo colunas de 
uma matriz a € M(m x n) como o número máximo de colunas line- 
armente independentes em a. Este número é igual à dimensão do 
subespaço vetorial de R” gerado pelos vetores-coluna de a. (Espaço- 
coluna de a.) 

De maneira análoga, definimos o posto segundo linhas da matriz 
a e M(m x n) como o número máximo de linhas L.I. em a, ou seja, 
como a dimensão do subespaço vetorial de R” gerado pelos vetores- 
linha da matriz a. (Espaço-linha de a.) 

Embora o espaço-coluna e o espaço-linha da matriz a sejam sub- 
espaços de espaços vetoriais diferentes, vale o resultado seguinte: 


Teorema 8.2. Para toda matriz a e M(m x nn), o posto segundo 
linhas e o posto segundo colunas são iguais. 
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Demonstração: Seja p o posto segundo colunas da matriz a = 


la;]e M(m x n). Então existem p vetores w, = (bik,...,bmk) E RP 
tais que cada uma das colunas v; — (aj,...,0mj), | <j<nm, é 
combinação linear de w1,...,Wp: 
P 
=D cm 1 <j <n. (*) 
k=1 


Tomando a i-ésima coordenada de cada um dos membros de (*), ve- 
mos que 


p p 
dij = pa Ckbik = pa bikck, ag 
k=1 Ei 


para quaisquer i,j, com | <i<mel<j;<nm. Considerando agora 
os vetores-linha u; = (a;,..., ain) da matriz a, juntamente com os 
vetores z; = (Ck,...,Ckn), 1 < k < p, observamos que a igualdade 
entre o primeiro e o terceiro membro de (**) significa que, para todo 
i=1,...,m tem-se 


P 
= bad Ixi<m. 
k=1 
Assim, os vetores-linha de a são combinações lineares de z1,...,Zp, 


portanto o posto de a segundo linhas é < p. Aplicando este resultado 
à matriz a! (chamada a transposta de a), que tem como linhas as 
colunas de a e como colunas as linhas de a, concluímos que o posto 
de a segundo colunas é menor do que ou igual ao posto segundo 
linhas. Isto conclui a demonstração. 














Podemos então definir o posto de uma matriz como o número 
máximo de linhas, ou de colunas, L.I. dessa matriz. Mesmo quando 
a matriz é quadrada (em cujo caso suas linhas e colunas pertencem 
ao mesmo espaço R”) os subespaços gerados pelas linhas e pelas 
colunas, respectivamente, podem ser diferentes mas têm a mesma 
dimensão. 


Exemplo 8.5 (Uma aplicação do Teorema 8.2.) Sejam f4,..., fm:E > 
R funcionais lineares não-nulos no espaço vetorial E, de dimensão 
n. Vimos no Exemplo 6.10 que, para cada i = 1,...,m, o núcleo de 
f; é o subespaço vetorial, de dimensãon — 1, Hi = (ve Efilv) = 0) 
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(hiperplano em E). A interseção desses m hiperplanos é o subespaço 
vetorial F = H; N...M Hm, formado pelos vetores v E E que cum- 
prem simultaneamente as condições fi(v) = 0,...,fm(v) = 0. Qual 
é a dimensão do subespaço F? Usando o Teorema 8.2 (juntamente 
com o Teorema do Núcleo e da Imagem), mostraremos agora que 
dim F = n — 7, onde r é o número máximo de elementos linear- 


mente independentes no conjunto (fj,..., fm, isto é, a dimensão do 
subespaço de E* gerado por estes funcionais. 

Com efeito, fxemos uma base V = (vs,..,vWm) EC E e seja 
la;1,..., Gin] a matriz de f; nesta base (i = 1,...,m). Temos q; = 


fi(v;). Isto nos dá uma matriz a = [a;] e M(m x n), cuja i-ésima 
linha é a matriz de f;, logo o posto de a segundo linhas é r. Segue- 
se do Teorema 8.2 que os vetores-coluna wy,...,wn de a geram um 
subespaço de dimensão r em R”. Ora, o subespaço gerado em R” 
pelos w; é a imagem da transformação linear A: E > R”, definida 
por Av = (fi(v),...,fm(v)), para todo v E E. De fato, 


Av; = (filvj),..., fm(vi)) 
= (Oijoe ces ag) = Wi, j = 12 essi, 
Evidentemente, o núcleo de A é o subespaço F. Resulta então do 


Teorema do Núcleo e da Imagem que dim F = dim E — dim Zm(A) = 
n-—r. 


Exemplo 8.6. O espaço-linha e o espaço-coluna da matriz 


> 1 


são duas retas distintas em R2. 


Exercícios 


8.1. Determine a matriz do operador linear A: R? — Rº, relativa- 
mente à base canônica, sabendo que A(1,1) = (2,3) e A(-1,1) = 
(4,5). 


8.2. O produto vetorial de dois vetores v = (x,y,z) e w = (x,y',Z') 
em Rº é, por definição, o vetor v x w = (yz' — zy', 2x —xz', xy! — yx'). 
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Fixado o vetor u = (a,b,c), determine a matriz, relativamente à 
base canônica, do operador A: Rº — Rº, definido por À .v = v x 
u. Descreva geometricamente o núcleo desse operador e obtenha a 
equação da sua imagem. 


8.3. Determine a matriz do operador de derivação D: P, — P, rela- 
tivamente à base (1, t,t2,...,t"). 


8.4. Considere os subespaços vetoriais Fe G do espaço C“(R), cujas 
bases são, respectivamente, os conjuntos (cos x, sen x) e 


2 pe 3 É) 


[e*cos x,e* sen x,e* cos x,e* sen x,e'* cos x,e** sen x). 
Determine a matriz do operador de derivação em cada um desses 


subespaços. 


8.5. Seja A: E — F uma transformação linear de posto r entre 
espaços vetoriais de dimensão finita. Prove que existem bases U = 
tu... Un) CEeV=lv...ovm) € F, relativamente às quais a 
matriz a = la;] de Atem ay =-:-= ar = 1 e os demais a; = 0. 


8.6. Ache o valor de x para o qual operador P: Ré > Rº, cuja matriz 
na base canônica é 


| 
vd 
je! 
X = 


seja uma projeção. 


8.7. Qual é a matriz, na base canônica, do operador A: R? — Rº tal 
que A(2,3) = (2,3) e A(-3,2) = 0? 


01 


8.9. Seja E = H & F. Dado o operador linear A: E > E, defina 
transformações lineares Ay: F > H,Ax:H > 6,An:hb 5 He 
Az: F; > É tais que, paratodov = vi +vz E E, comv, EH eve k, 
seja 


8.8. Calcule a n-ésima potência da matriz f l l 


Av = (Am + Az)vi + (As + Azobva. 


Diz-se então que 


a = 
At Ago 
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é a matriz do operador A relativamente à decomposição E = H & Fa. 
Dado outro operador linear B: E — E, determine a matriz de BA 
relativamente à mesma decomposição. 


8.10. Com a notação do exercício anterior, sejam a e b as matrizes 
de A e B respectivamente, em relação a uma base 4, UU, C E, onde 
Ui che ck são bases. Mostre que se 


an am bi da 
a= e b= 
a é hi bz> 
então 


“ |byan+byazs bras +biaz 
ba = 
bzan + ba b21aj2 + bz2az> 





(Multiplicação por blocos de matrizes.) 


8.11. Seja a uma matriz 5 x 5 cujos elementos sobre a diagonal e 
abaixo dela são iguais a zero. Sem fazer nenhum cálculo, conclua 
que a” = 0. 


8.12. Sejam a uma matriz m xn, com m <n,e b uma matriznxm. 
Podem ab e ba ser ambas invertíveis? Uma delas? Qual? Quando? 


8.13. Assinale verdadeiro (V) ou falso (F): 


( ) Se A,B: E > E são operadores de mesmo posto r então o pro- 
duto BA tem posto 7. 


( ) Se as matrizes a,b e M(m x n) têm o mesmo espaço-coluna 
então elas são matrizes da mesma transformação linear. 


() A matriz do operador linear A: ESE na base (vy, V2,V3,...,Vn) 
difere da matriz do mesmo operador na base (vz, Vv1,V3,...,Vn) 
pela permutação das duas primeiras colunas. 


( ) SejamaeM(2x3)ebe M(3x2). Se ab = L então ba = E. 
( ) Se a matriz a” se obtém da matriz a por uma permutação de 


suas linhas então a' e a têm o mesmo posto. 


8.14. Seguindo a orientação ali fornecida, prove as propriedades 1) 
a 7) da multiplicação de matrizes listadas após a demonstração do 
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Teorema 8.1. Em particular, prove que se a e b são matrizes n x mn 
com ba = L, então se tem também ab = L,. (Cfr. Corolário do 
Teorema 6.7.) 





8.15. Sejam dados os vetores vj,...,vn E R”. Se, para cada j = 
1,...,n, 0 j-ésimo vetor da base canônica de R” se exprime como 











e =Xgvi + + XnjVn 
prove que x — [xi] é a inversa da matriz que tem v1,...,Vn como 
vetores-coluna. 


8.16. Determine a inversa da matriz Ê 


0ceM(rxs). 


8.17. Sejam a € M(m x m) uma matriz de postoreb e M(n x n) 
uma matriz de posto s. Prove que a matriz (m+n) x (m+n) abaixo 


tem posto r+s: 
a 0 
0 b 


O símbolo O na primeira linha significa a matriz nula m xne, na 
segunda linha, 0 e M(n x m). 


| ondea e M(s xt) e 
s 


8.18. Dadasa e M(mxm),be M(ínxn)ece M(mxnmn), com posto 
dea=re posto deb =s, que postos pode ter a matriz abaixo? 


o» 


b E 
a/" Com b £ 0, a matriz de um operador A: R? > R? 
na base canônica. Ache uma base de R? na qual a matriz de A seja 


8.19. Seja [: 


0 1 
bec—-ad a+d| 
8.20. Determine a matriz da projeção P:R? — R?, P(x,y) = (x,0) 
relativamente à base (u,v) C Rº, ondeu = (1,1) ev = (1,2). 


8.21. Sabendo que a matriz do operador A: Rê — Rº relativamente 
à base (u,v,w) C Rº,ondeu = (1,1,1),v=(1,2,1),w = (1,1,3), é 


Sd dd 3 
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determine a matriz de A relativamente à base canônica de Rº. 


8.22. Obtenha basesU C RºeV c Rº relativamente às quais a 
matriz da transformação linear A: R? — Rº, dada por A(x,y) = (2x+ 
y, 3x — 2y,x + 3y), tem as linhas (1,0), (0,1) e (0,0). 


8.23. Suponha que os operadores lineares A, B: E > E têm a mesma 
matriz a = [a;] em relação a duas bases ,V C E. Prove que existe 
um isomorfismo C: E — E tal que B= CAC”!. 


8.24. Seja A: R? — Rº o operador cuja matriz na base canônica é 


E ol 


an a 
a= [MM 2 
21 2 
é a matriz de A relativamente a uma base qualquer de Rº então 


az £ O ou a, £ O. (Noutras palavras, nenhuma matriz de À é 
diagonal.) 


Prove que se 


8.25. Considere as transformações lineares 


ALR Pi, Alo, 01. 0n) = + gx + cep on 


B: Pr, > Rº*!, B.p(x) = (p(0),p(D,...,p(n)). 


Determine a matriz de BA: R"*! — R?+! (na base canônica) e prove 
que é uma matriz invertível. 


8.26. Seja a a matriz n x n cujas linhas são os vetores v; = (1,2,... 
sn), v2=(n+4+1,n+42,...,2n), etc. Prove que o posto de a é igual 
a 2 e que o subespaço de R” gerado por suas linhas coincide com o 
subespaço gerado por suas colunas. 


8.27. Prove que uma matriz e = [c;] e M(m x n) tem posto 1 se, 
e somente se, existem vetores não-nulos a = (q,...,am) E RM e 
b=(by,...,bn) ER” tais que ci — a;.b; para todo i e todo j. 
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8.28. Assinale V(erdadeiro) ou F(also): 
( ) Toda matriz é soma de matrizes de posto 1. 


( ) O conjunto das matrizes de posto k em M(mxn) é um subespa- 
ço vetorial. 


( ) Amatriz 
X2 ... E 
yI UZ2 -.. Un 
tem posto 2 se, e somente se, existem i, j tais que x;y; 2 XjUi. 


( ) SeA: E > E é um operador linear de posto 1 então E = N(A)J& 
Tm(A). 


8.29. Prove que uma matriz m x n tem posto r se, e somente se, é 
possível selecionar r linhas e r colunas (porém não mais) de modo 
que os elementos comuns a elas formem uma matriz invertível r x r. 
[Sugestão: reduza ao caso r = min(m,n) e aplique o Teorema 8.2.] 


8.30. Sejam fy,..., fm: E > R funcionais lineares no espaço vetorial 
E de dimensão n. Suponha que estes funcionais gerem em E* = 
£L(E;R) uma variedade afim de dimensão r. Prove que o conjunto F, 
formado pelos vetores v € E tais que 


filv)= flv) == Tm(v), 
é um subespaço vetorial de dimensão n — r + 1. 


8.31. Uma matriz n x n chama-se um quadrado mágico quando a 
soma dos elementos de cada uma de suas linhas, de cada coluna, 
da diagonal principal e da outra diagonal (ao todo 2n + 2 somas) 
são iguais. Prove que, se n>3, o conjunto Qn dos quadrados mágicos 
nxn é um subespaço vetorial de dimensão n?—2n do espaço M(n xn). 
[Sugestão: use os Exercícios 8.30, 3.32 e 3.33.] 


8.32. Em conformidade com o exercício anterior, determine os 8 ele- 
mentos restantes da matriz 4 x 4 abaixo, de modo a obter um qua- 
drado mágico 


12 3 + 
|) 5 6 À 
7 8 * x 
/ * x á 
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8.33. Calcule o posto da matriz 


3 
6 


1 
4 
z 0 


— MM 


e mostre que o subespaço gerado por suas linhas é diferente daquele 
gerado por suas colunas. 


8.34. Obtenha números a, b, c tais que ax + by + cz = O seja a 
equação do plano gerado pelas colunas da matriz 


111 

| 2.3 

234 

8.35. Seja A: E — E um operador linear no espaço vetorial E, de 
dimensão finita. Supondo que À não seja um múltiplo do opera- 
dor identidade, mostre que existem bases de E do tipo (v,Av,...J e 
(v,2Av,...:. Relativamente a estas bases, as matrizes de A são di- 
ferentes. Conclua que os operadores «l são os únicos cuja matriz 
não depende da base escolhida e que as matrizes do tipo al, são as 
únicas que comutam com todas as matrizes invertíveis n x n. 


8.36. Seja a uma matriz triangular (isto é, a; — Osei < j)nxn cujos 
elementos da diagonal são todos iguais a zero. Mostre que a” = 0. 
[Sugestão: considere o operador A:R”" > R” cuja matriz na base 
canônica é a.] 


8.37. O traço de uma matriz quadrada a — [a;] e M(n xn) é a soma 
tra = q + --- + am dos elementos da sua diagonal. Prove que 
tr (ab) = tr (ba) e conclua que todas as matrizes do mesmo operador 
A: E > E, num espaço E de dimensão finita, têm o mesmo traço, o 
qual se indica com a notação tr A. 


8.38. Prove que o traço de um operador linear idempotente P: E > E 
é um número inteiro, igual ao seu posto. 


8.39. Seja e — [ci] € M(n x n) uma matriz de posto 1. Prove que 
c” = (tr c).c e, mais geralmente, para todon > 1,e" = (tr e) e. 
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8.40. Sejam YU, V e W bases finitas do espaço vetorial E. Se p e q são 
respectivamente as matrizes de passagem de 4 para V e de V para 
W, prove que as matrizes de passagem de 4 para W e de V para U 
são respectivamente pq e p|. 


8.41. Prove que o posto da transformação linear BA é menor do que 
ou igual ao posto de À e ao posto de B. Dê um exemplo em que posto 
de À = posto de B > posto de BA. 


8.42. Dada a transformação linear A: E — F, entre espaços de di- 
mensão finita, sejam E; C E e Ff € F subespaços tais que E = 
N(A) 9 E eF = Zm(A) & KH. Tome basesYy c Ee Vc Fcujos 
primeiros elementos formam respectivamente uma base de N'(A) e 
uma base de Zm(A). Que forma tem a matriz de À relativamente a 
UeV? 


8.43. Sejam A:E > Fe B:F > G transformações lineares entre 
espaços vetoriais de dimensão finita. Se B é injetiva, prove que o 
posto de BA é igual ao posto de A. Que condição sobre A assegura 
que o posto de BA seja igual ao de B? 


8.44. Se E tem dimensão finita, prove que não existem operadores 
lineares A,B: E > E tais que AB — BA = I ou tais que AB — BA seja 
uma projeção. (Use o traço. Compare com o Exercício 5.13.) 


8.45. Sejam V,V' c Ee W,W' c F bases finitas, e p, q as matrizes 
de passagem de V para V' e de W para W' respectivamente. Dada 
a transformação linear A: E — F, sejam a e a” respectivamente as 
matrizes de A relativamente às bases V, W e V',W'. Mostre que p é 
a matriz de Ig nas bases V',V e q é a matriz de I; nas bases W',W. 
Use as igualdades A = Alç e À = IFA para provar que ap e qa” 
são iguais à matriz de À nas bases V', W. Obtenha assim uma nova 
dedução da fórmula a' = q !ap. 


8.46. Prove que uma matriz quadrada de posto 1 é idempotente se, 
e somente se, seu traço é igual a 1. 


Esta seção trata de aspectos computacionais dos assuntos tratados 
até aqui. Do ponto de vista do encadeamento lógico, sua leitura não 
é necessária para o entendimento das seções seguintes. (Salvo no que 
tange à Seção 17 que, por sua vez, quase nada influi nas que lhe se- 
guem.) Entretanto seu valor educativo é inestimável pois exibe um 
processo simples e bem sucedido para responder a perguntas natu- 
rais sobre subespaços, transformações lineares, sistemas de equações 
e matrizes. 


Estudaremos a seguir algumas questões de natureza prática que 
serão resolvidas com o uso do tradicional e eficiente método de eli- 
minação. 


9.A. Dimensão do subespaço gerado por m vetores 


A primeira questão que abordaremos é o problema de determinar 
a dimensão do subespaço gerado por m vetores v1,..., Vm No espaço 
vetorial E que, por simplicidade, (porém sem perda de generalidade) 
suporemos ser 0 espaço euclidiano R”. Noutras palavras, queremos 
achar o número r tal que r dos vetores dados são linearmente inde- 
pendentes porém os demais são combinações lineares deles. 

O princípio básico a ser utilizado é a observação óbvia de que 
se um dos vetores dados, digamos v;, tem uma de suas coordena- 
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das, por exemplo a j-ésima, diferente de zero mas todos os demais 
vetores v2,...,Vm têm a j-ésima coordenada nula então v; não é 
combinação linear de vz,...,Vm- Resulta então do Teorema 3.2 (ou 
melhor, da observação logo após) que se cada um dos vetores não- 
nulos w1,...,Wwr tem uma coordenada diferente de zero e a mesma 
coordenada é zero em todos os vetores seguintes a ele nesta lista 
então (w,...,wr) é LI.. 


Exemplo 9.1. Sejam v; = (0,1,2,3,4), vz = (0,0,1,2,3), e v3 = 
(0,0,0,0,1). Neste caso, a segunda coordenada de v; é 1 mas as 
segundas coordenadas de v; e v3 são nulas. À terceira coordenada de 
vz é 1 mas a terceira coordenada de v3 é zero. Logo (vi, v2,Vv3) C Rº é 
um conjunto L.l.. 

O critério acima enunciado, que garante a independência linear 
dos vetores w1,...,Wwr E R", pode ser refraseado assim: a primeira 
coordenada não-nula de cada w; tem índice menor do que a primeira 
coordenada não-nula dos vetores subsegientes w;,1,...,Wr. 

Se, para cada i = 1,...,r, escrevermos w; = (aiy,..., Gin), te- 
remos uma matriz a — [a;] e M(r x n), cujos r vetores-linha são 
W1,...,Wr. Diremos que essa matriz é escalonada quando o primeiro 
elemento não-nulo de cada uma de suas linhas está à esquerda do 
primeiro elemento não-nulo de cada uma das linhas subsequentes e, 
além disso, as linhas nulas (se houver) estão abaixo das demais. 

Com esta definição, podemos dizer que as linhas não-nulas de 
uma matriz escalonada são vetores linearmente independentes, ou 
seja, uma matriz escalonada r x n tem posto r se suas linhas forem 
todas diferentes de zero. 


Exemplo 9.2. As matrizes abaixo são escalonadas: 


o 
ao | [00-45 2 
a RS E 

o 0000] 


Ambas têm posto 3. 

Dados os vetores vj,...,Vm € R”, vamos alterá-los passo a passo 
de tal modo que, em cada etapa, os vetores obtidos geram o mesmo 
subespaço que os da etapa anterior e, no final, os vetores resultantes 
formam as linhas de uma matriz escalonada. Os não-nulos dentre 
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eles formarão uma base do subespaço gerado pelos vetores original- 
mente dados. 
As seguintes modificações, cnamadas operações elementares, le- 
/ / n 
vam os vetores v;,...,Vm € R" em vetores vj,...,vm € R” que geram 
o mesmo subespaço: S(v4,...,Vim) = S(vi,...,Vm). 


(1) Trocar a posição de dois vetores v;, v; (i < j) na lista dada. Esta 
operação é esquematizada como 


Mipatoç iara Vas Um Maas Hp correr Pude 


(2) Somar a um dos vetores um múltiplo de outro vetor da lista, ou 
seja, substituir v; por v; = pel E | 


Para justificar a operação (2), sejam V = (vy,..svm) e V' = 
(vips Vip cos Vm). Evidentemente S(V) c S(V). Além disso, como 
vj= vj — «v;, segue-se que S(V) c S(V”). Logo V e V' geram o mesmo 
subespaço: S(V) = S(V”). 

Em termos da matriz cujas linhas são os vetores dados, estas 
operações elementares se exprimem assim: 


(1) Trocar a posição de duas linhas; 
(2) Somar a uma linha um múltiplo de outra linha. 


Portanto, o subespaço gerado pelas linhas (ou seja, o espaço- 
linha) de uma matriz não se altera quando essas duas operações 
elementares são aplicadas a essa matriz. 

Descreveremos a seguir o processo de eliminação (ou escalona- 
mento), o qual, mediante aplicações sucessivas das duas operações 
elementares às linhas de uma matriz, produz uma matriz escalo- 
nada. O procedimento é o seguinte: 


(a) Se am 0, o processo começa deixando a primeira linha intacta 
e somando a cada linha L;, com i > 2, a primeira linha multiplicada 
por —a;/ay. Com isto se obtém uma matriz cuja primeira coluna é 
(on Daas0). 


(b) Se aj = 0, uma troca de linhas fornece uma matriz com ay £0, 
desde que a primeira coluna não seja nula. Se, porém, todos os ele- 
mentos da primeira coluna são iguais a zero, passa-se para a se- 
gunda coluna ou, mais geralmente, para a coluna mais próxima, à 
direita da primeira, onde haja algum elemento não-nulo e opera-se 
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como antes, de modo a obter uma matriz cuja primeira coluna não- 
nula começa com elemento < O mas todos os demais são iguais a 
zero. À partir daí não se mexe mais na primeira linha. Recomeça-se 
o processo, trabalhando com as linhas a partir da segunda, até obter 
uma matriz escalonada. 


Exemplo 9.3. Sejam os vetores 


VI = (1,2,3,4), 
V2 = (56; 7,8) e 
v3 = (9,10,11,12) 


em Rº. Indicamos abaixo a sequência de operações elementares efe- 
tuadas sobre a matriz cujas linhas são estes vetores, conduzindo a 
uma matriz escalonada 





E gs 4 LE R 4 
5 6 E O 4 =ê eo) FP 
21,0 11 2) PA lo =g =i6 = 
set E & 4 
yo Ap = Jó 
0 0 00 


Como a matriz escalonada final tem duas linhas diferentes de zero, 
os três vetores dados geram um subespaço vetorial de dimensão 2 
em R*ew = (1,2,3,4), w = (0,-4,-8,-12) formam uma base 
desse subespaço. 

No exemplo acima, como nos seguintes, a notação L; + al; signi- 
fica que a matriz à direita foi obtida da matriz à esquerda somando- 
se à i-ésima linha o múltiplo al; da j-ésima linha. Analogamente, 
usaremos a notação L; — L; para indicar a troca da linha i pela li- 
nha j. 


Exemplo 9.4. Consideremos os vetores v; = (0,1,2,3), vz = (2,1, 
3,0), v3 = (3,4,2,0) ev = (4,2,0,1) em Rº. Indicamos abaixo a 
sequência de operações elementares efetuadas sobre a matriz que 
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tem esses vetores como linhas a fim de obter uma matriz escalonada 


07123 213809 2) 38 6 
213 0) non |0 123) lh /0 1 23 
3420 3420|uz |O 5-0 
4201 4201 0 0 6 1 

21 3/0 213 0 
Ls-5L |0 1 2 E Lamáls 012 3 

1 
00 -B 00 BD 3 
00 —6 1 00 0 7 


Concluímos que os quatro vetores dados são L.I., portanto consti- 
tuem uma base de R?. Além disso, vemos que os vetores w; = 
(2,1,3,0), W27 = [(0,1;2;3), W3 = (0, —2,—B) e wa = (0,0,0,7) 
também formam uma base de Rº. 


9.B. Cálculo do posto de uma transformação linear 


À resposta à questão 9.A permite determinar o posto de uma trans- 
formação linear A: R” — R” e até mesmo uma base para Zm(A). 
Uma tal base pode ser formada pelas colunas não-nulas de uma ma- 
triz escalonada, obtida da matriz de A por meio de operações ele- 
mentares efetuadas sobre suas colunas. Ou então podemos, como 
acima, operar sobre as linhas da transposta da matriz de A. (Pois 
as linhas da transposta são as colunas da matriz dada.) Não haverá 
confusão se lembrarmos que a base de Zm(A) é formada por vetores 
de R”, não de R”! Quando m =», é preciso ter cuidado, pois a ima- 
gem de A é gerada pelos vetores-coluna de sua matriz e não pelos 
vetores-linha. 


Exemplo 9.5. Obter uma base para a imagem da transformação 
linear A: Rº — Rº, definida por 


Alm uy,2) = (x+-5uy 4-922,2x + 64 4 102,3% ++ 7u + 12,4x+5 8y ++ 125). 


Temos Ae, = (1,2,3,4), Ae2 = (5,6,7,8) e Ae3 = (9,10,11,12), de 
modo que a imagem de À é gerada pelos vetores v1, vz, v3 do Exemplo 
9.3. Resulta então daquele exemplo que À tem posto 2 e os vetores 
wi = (1,2,3,4), w2 = (0,4, -8,—12) formam uma base de Zm(A). 
Note que a matriz que ocorre no Exemplo 9.3 não é a matriz de À e 
sim a sua transposta. 
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9.€. Resolução de sistemas lineares 


O método de eliminação, embora simples e ingênuo, é a maneira 
mais eficaz de resolver um sistema de m equações lineares, com n 
incógnitas, apresentado sob a forma matricial ax = b, onde a € 
M(mxn)xeM(nxN)ebeM(mx 1). 

Resulta das noções gerais até aqui estudadas que o sistema ax = 
b possui solução se, e somente se, o vetor b € R”, correspondente à 
matriz b, pertence à imagem da transformação linear A: R” > RM 
cuja matriz (nas bases canônicas de Rº e R”) é a. 

Dito de outra maneira, o sistema ax = b possui solução se, e 
somente se, o vetor b € IR” (correspondente à matriz b) pertence 
ao subespaço gerado pelas colunas de a. Isto equivale a dizer que a 
matriz aumentada [a;b] e M(m x (n + 1)) tem o mesmo posto que a 
matriz a do sistema. 

Uma afirmação mais completa é a seguinte: o sistema Ax = b 
não possui solução quando b é Zm(A), possui uma única solução 
quando b € Zm(A) e À é injetiva, e possui infinitas soluções quando 
be Zm(A) e À não é injetiva. (Vide Teorema 6.4.) 

Em termos matriciais, o sistema ax = b, com a E M(m x mn), 
xe M(nx1)ebe M(mx 1), admite as seguintes alternativas: 


(1) Não possui solução quando o posto da matriz aumentada [a;b] é 
maior do que o posto de a; 


(2) Possui uma única solução quando a matriz a e a matriz aumen- 
tada [a;b] têm o mesmo posto, igual ao número n de incógnitas; 


(3) possui infinitas soluções quando se tem posto [a;b] = posto a = 
r <m. Neste caso, o conjunto das soluções é uma variedade afim de 
dimensão n — 7. 


O que acabamos de dizer é mais ou menos um resumo do que 
já vimos antes. Trata-se de uma discussão esclarecedora do ponto 
de vista teórico mas que não ensina como reconhecer, na prática, 
em qual dos casos se enquadra um sistema dado e muito menos 
como obter suas soluções, caso existam. Isto se faz com o método 
de eliminação, escalonando a matriz aumentada do sistema. 

O processo de eliminação se baseia na observação de que ao efe- 
tuar uma operação elementar sobre as linhas da matriz aumentada 
[a;b] obtém-se uma matriz [a';lb'] que é a matriz aumentada de um 
sistema a'x — b”, equivalente ao sistema original ax = b. (Dois sis- 
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temas se dizem equivalentes quando possuem o mesmo conjunto de 
soluções.) 

No final do processo, obtém-se um sistema a'x = b”, equivalente 
ao sistema proposto ax = b, no qual a matriz [a';b'] é escalonada. 
(Isto é o mesmo que dizer que a' é escalonada.) O sistema a'x = b' é 
facilmente resolvido de baixo para cima: acha-se primeiro o valor da 
última incógnita, substituindo-a por esse valor na equação anterior 
e assim por diante. 

Vejamos alguns exemplos. 


Exemplo 9.6. Consideremos o sistema 





+ Zoo pH = 
e od mp DE = 1 
3x + 4y + 22 = 1 
4x + 2y ts 4 





O escalonamento da matriz aumentada é feito abaixo: 





01231 21301 
21301 = 01231 Es 
34201 34201 
4 2011 420111 
213 0/1 21 3 0 1 
= 012 3/1 o 01 2 3 1 
o 35000 E E 3) 
o O é 1 oo 0 7 £| 
Obtém-se assim a matriz aumentada do sistema 
2% Dom de dz =. 
yr 22 + 38 = 1 
Bz = Bt = = 
df = da 
Resolvendo este sistema de baixo para cima, vem: t = É, Z = E, 


y=0,x= 4. Esta é a única solução do sistema dado. Como a matriz 
do sistema tem posto 4, a solução existiria e seria única, fosse qual 
fosse o segundo membro. 
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Exemplo 9.7. Seja o sistema 
* + My = dd = 4 
e + dy df dz = 5 
dx + iy - 2 = 2 


O escalonamento da sua matriz aumentada é o seguinte: 





dl do = A po A =5 4 1 2 -5 4 
2 o 4 9h=>/0 1 os po = 10 =5 
47 22 O — 10 —4 o O O =] 


Vemos portanto que o sistema dado é equivalente a: 


dy - = 4 
= q olz e =) 
e -- Og + E = + 


o qual é obviamente impossível. O sistema dado não tem solução. 
[Poderíamos ter chegado à mesma conclusão observando, na forma 
do Exemplo 9.5, que a imagem do operador A: Ré — Rº, cuja ma- 
triz tem colunas v; = (1,2,4),v2 = (2,3,7) e vz = (-3,4, 2), é um 
subespaço de dimensão 2 em Rº do qual os vetores w, = (1,2,4) e 
w> = (0,1,1) formam uma base e que o vetor b = (4,5,12) certa- 
mente não é combinação linear de w; e w2.] 


Exemplo 9.8. Seja o sistema 


x + Wy + 32 + 4 = 
de + Oy + ZE + Bb = 2 
e E ty 4 Ma Sp TÃt=s Ss 


O escalonamento da sua matriz aumentada segue o esquema: 








12 3 4 1 12 3 4 1 
» 6 8 2 —Ss 0 —4 8 IZ —3 , 
2 Po Ji 423 O —8 —16 —24 —6 

E & Ss 1 
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A última matriz obtida é a matriz aumentada do sistema: 





x + 2Wy + 32 + 4 = 1 
4y 8z It = =5 
ou 
x + 2y = —-3z2 — 4 + 1 
- dy = da + RE = 3 


Este sistema pode ser resolvido de baixo para cima (esquecendo que 
ze t são incógnitas) e nos dá a solução: 


3 1 
v=-22-3t +35, x=2+2-s. te) 
O sistema dado possui portanto uma infinidade de soluções, que po- 
dem ser obtidas atribuindo-se valores arbitrários a z e t e calcu- 
lando x e y em função delas por meio destas duas últimas igualda- 
des. Observe que as igualdades (*) são as equações da variedade 
afim de dimensão 2 no espaço Rº, formada por todas as soluções do 
sistema dado. Escrevendo o sistema original sob a forma Av = b, 
onde A: Ré — Rº é a transformação linear cuja matriz tem as linhas 
(1,2,3,4), (5,6,7,8), (9,10,11,12) e b = (1,2,3), esta variedade afim, 
formada por todos os vetores 
1 3 
v=(z+2t ” 2z — 3t + ru 
onde z, t são números reais arbitrários, é o conjunto de todos os 
vetores v € Rº tais que Av = b. 


st)ecR, 





Observação: O conjunto F = ((z+2t,-2z-—3t,z,t) E Rº;z,t E 
R) é um subespaço vetorial de Rº, núcleo da transformação linear 
A: Rº — Rº acima considerada. Uma base de F é formada pelos ve- 
tores w; = (1,-2,1,0) em, = (2,-3,0,1), obtidos fazendo z = 1,t = 0 
e depois z = 0, t = 1 na expressão dos vetores de F. De um modo ge- 
ral, para obter uma base para o núcleo de um operador A: R”" > RM 
o que se tem a fazer é resolver por escalonamento o sistema Ax = 0. 


Exemplo 9.9. Achar uma base para o núcleo da transformação li- 
near A: Ré — Rº cuja matriz (nas bases canônicas) é 


LoZ de | Z 
a=|3 4 5 34 
[o 1d 
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O núcleo de À é o conjunto das soluções x = (x1,x2,X3, X4,X5) do sis- 
tema linear homogêneo 


x + 2x + 3x + x + 2x = 0 
3x + 4x + 5x + 3x + 4x = 0 
X1 == X3 + X4 = 0. 


Para sistemas homogêneos, não há necessidade de considerar a ma- 
triz aumentada. O escalonamento da matriz a é feito segundo o 
esquema 











[2 3 TZ 1 A Bd 1 Z 
34 5 34 410 2 4 0 —2 , 
1D=-| dt O O 2 4 0 —2 
Ed ão do 
310 —2 4 0 —2 
O 0 0 00 


Portanto o sistema homogêneo inicial é equivalente ao sistema esca- 
lonado 





x + 2x + 3x + x + 2x = 0 
— 2x — 4% — 2x = 0, 
ou seja 
x + 2x = —3x3 x4 2Xs5 
E 2x2 = 4x3 + 2Xs5. 


Resolvendo o último (considerando x3, x, e x; como conhecidos), vem 
x2 = —2x3 — xs e x1 = x3 — x. Concluímos então que o núcleo da 
transformação linear A é formado por todos os vetores x = (x3 — 
X4, —2X3 — X5, X3, X4, X5), onde os números x3, x, e x; são escolhidos 
arbitrariamente. Uma base do núcleo é obtida quando se faz suces- 
sivamente (x3, X4; X5) == a , 0, 0), (x3, X4; X5) = (0, 1 , 0) e (x3, X4, X5) == 
(0,0,1). Explicitamente, essa base é formada pelos vetores w| = 
(1,=2,1,0,0], wa E (—1,0,0,1,0) ew3 = (0,=1,0,0,1). 
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9.D. O método de Gauss-Jordan 


A quarta aplicação que faremos do método de eliminação é o cálculo 
da inversa de uma matriz (invertível) a e M(nxn). Antes porém de- 
vemos advertir que a determinação da inversa não é necessária para 
resolver o sistema ax — b. A expressão x — a !.b para a solução 
desse sistema é de grande elegância e significado teórico porém, na 
prática, a obtenção explícita da inversa a! requer a solução de n 
sistemas lineares. Convenhamos que isto seria um modo pouco efi- 
caz de resolver um único sistema. 


Com efeito, examinando coluna por coluna cada membro da 


igualdade aa”! = L,, vemos que a j-ésima coluna de a”! é a solução 
do sistema ax = e;, portanto o cálculo da inversa a! equivale a 
resolver os n sistemas lineares ax — €e1,...,aX — €n. 


O método de eliminação que vimos utilizando é também chamado 
“método de Gauss”. Existe ainda o “método de Gauss-Jordan”. 

Ele continua a eliminação iniciada pelo método de Gauss, che- 
gando no final a uma matriz escalonada, com a propriedade adicio- 
nal de que, acima e abaixo do primeiro elemento não-nulo de cada li- 
nha, todos os elementos são iguais a zero. Se a matriz for (quadrada 
e) invertível, o primeiro elemento não-nulo de cada linha da matriz 
escalonada está sobre a diagonal. Portanto, neste caso, o método de 
Gauss-Jordan produz uma matriz cujos elementos não-nulos consti- 
tuem a diagonal. 


Vejamos um exemplo da eliminação de Gauss-Jordan. 


Exemplo 9.10. No Exemplo 9.4, o método de eliminação de Gauss 
em resumo operou a seguinte transformação por meio de operações 
elementares sobre as linhas: 


SN w MN 

+ oSOoOWw 

S0o0o0ohmN 
as WO 
Sa 
“Wo 
q 


OD O + a 
| 
N| 
| 
N| 


1 
1 
4 
2 


E wN O 


O método de Gauss-Jordan continua, aplicando as operações ele- 
mentares sobre as linhas, de modo a anular também os elementos 
de cada coluna situados acima da diagonal. Ele prossegue a partir 
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daí com as seguintes operações elementares: 








21 3 Õ 20 1 —3 
012 3 Ts; 01 2 3 Niigla 
iba e 0 0-5 Sl) tais 
00 0 7 00 0 7 
20 0 —4 20 0 0 
Ltigls 01 0 1 fe e 01 0 0 
Ea [Po c=P=d qr 00-70 
00 0 7 La+ La 00 0 7 


Esta última matriz diagonal resulta portanto da matriz inicial 
pela aplicação sucessiva de operações elementares sobre suas linhas. 

Existe ainda uma terceira operação elementar, que não tivemos 
ainda ocasião de mencionar porque não foi necessária até agora, mas 
que tem também a propriedade de, aplicada às linhas de uma ma- 
triz, não alterar o seu espaço-linha. Ela é a seguinte: 


(3) Multiplicar uma linha por um número 0. 

Aplicando essa operação às linhas da matriz final do exemplo 
acima, obtemos a matriz identidade. (Multiplique a primeira linha 
por 1/2, a terceira por —2/15 e a quarta por 1/7.) 

O método de Gauss-Jordan fornece imediatamente a solução do 
sistema ax = b sem necessidade de, no final, efetuar a resolução de 
baixo para cima. Com efeito, depois de efetuada qualquer sequência 
de operações elementares (inclusive a terceira) sobre as linhas da 
matriz aumentada obtemos sempre um sistema equivalente a'x = 
b'. Se a matriz a é invertível, o processo de Gauss leva a uma matriz 
escalonada com elementos todos < O na diagonal. Prosseguindo a 
partir daí com Gauss-Jordan, chegaremos finalmente a um sistema 
a'x = b', equivalente ao original, com a” = L,, logo x = b”, o que nos 
dá a solução x diretamente. 

Assim, a solução do sistema ax = b é a última coluna da ma- 
triz [a';b'] que se obtém aplicando a eliminação de Gauss-Jordan à 
matriz aumentada [a;lb] de modo a chegar com a” = L,. 

Em particular, tomando b — e; (j-ésimo vetor da base canônica de 
R"), a solução x da equação ax — e;, que é a j-ésima coluna de a, 
se obtém efetuando operações elementares sobre as linhas da ma- 
triz aumentada [a;e;] até reduzí-la a [Ln;x]. Como essas operações 
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dependem apenas da matriz a mas não de j, isto sugere o tópico 
seguinte 


9.E. Método prático para calcular a inversa a” 


Acrescenta-se a matriz identidade I, à direita de a, de modo a ter 
uma matriz aumentada n x 2mn: 


071 2 ... Um [1 0... o 
1 2 ... am |O |. ssa Q 
: io: 

1 2 ... am 10 O ias 1 


Em seguida aplicam-se operações elementares às linhas dessa ma- 
triz aumentada de modo a reduzir a matriz a à identidade I,, che- 
gando-se a: 


10 sas 0 | xm X12 ... Xm 
0 1 0 | x2 X2 ... Xm 
DE O sra E LD a Di 


A matriz [x;;] à direita é a inversa de a. 


Exemplo 9.11. Damos abaixo um exemplo de como obter a inversa 
de uma matriz segundo este método. 





24 31100 24 3/1 00 
ol 1010501 1/0 10]5 
2 fo dd 0-1 31-50 
24 3/1 00 20 7/1 40 
ol 1/0 10/5[01 1,0 1 0)5 
00 5|-511 00 5|-5 11 
200/8 —& —M Lddj4 RB -í 
oO 10|-1 3 5 jo BA s j 
0 0 5-5 11 O 0 1-1 4/5 
Portanto o 
= 13 
2 3 4 —B 


O: 
(O E = 
| 
a 
I| 
| 
—a 
Ca NUa] UT 
Cof NQaI ho 
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Retornaremos ao asssunto de eliminação gaussiana no item final 


da seção 17. 


Exercícios 


9.1. Determine o posto da matriz 


lb 2Zo 34 

o BP? 8 

2. 10 1) 12)" 
13 14 15 7 


9.2. Ache a matriz, na base (uy, 2, u3, 14), da projeção P: Rº > Rº, 
Pl, y,2,t) = (x,y,0,0), sabendo que 1 — [2,0,3,4); U2 — (1, 1,4,2), 
us = (3,2,2,0) e w = (0,3,0,1). [Sugestão: use eliminação gaussi- 
ana para exprimir e;, ez, e3 e e; como combinações lineares de u;, 
Uz, U3 € 4 ] 


9.3. Exprima cada um dos vetores da base canônica de Rº como 


combinação linear dos vetores v; = (1,1,0), vz = (—1,0,2), v3 = 
1-1 4 
(4,2,-5) e, a partir daí, obtenha a inversa da matriz |1 O 2]. 
0 —2 5 


9.4. Decida se as matrizes abaixo são invertíveis ou não. No caso 
afirmativo, determine a(s) inversa(s). Caso uma delas (digamos a) 
não seja invertível, ache uma matriz x ce M(3 x 1) tal que ax = 0: 


a [Aa 
459 e 45 6 
134 134 


9.5. Calcule a dimensão do subespaço vetorial de Rº gerado pelos 
vetores vi = (2,4,8,-4,7),vz = (4,-2,-1,3,1), v3 = (3,5,2,-2,4) e 
va = (—5,1,7,-—6,2). Decida se o vetor b = (6, 18,1, -—9,8) pertence ou 
não a esse subespaço. 
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9.6. A matriz a € M(mxn) tem apenas uma linha e uma coluna não- 
nulas. Dada b e M(m x 1), quais são as dimensões possíveis para 
a variedade afim formada pelas soluções x € M(n x 1) do sistema 
ax=b? 


9.7. Exprima cada vetor do conjunto (u, v, w, z; EC E como combinação 
linear dos vetores (w,u + 3z,v — 2u + 3w,5z). 


9.8. Obtenha uma base para o subespaço vetorial gerado por cada 
um dos seguintes conjuntos e, consequentemente, determine a di- 
mensão daquele subespaço: 


(a) 1(1,2,3,4),(3,4,7,10), (2,1,3,5)) 

(b) 2 +2x2+3x +44, 5x) 4+4x2 43x 42,4%) 2x2 4x, 72 4+2x2 3x — 8 
(c) (1,3,5), (—1,3,—1), (1,21,1) 

(d) (1,2,3), (1,4,9),(1,8,27). 


9.9. Mostre que se 0, 1, a, b, c são números dois a dois diferentes 


então os vetores (1,1,1,1), (a, a2, a2,a?), (b, b2, b2,b?) e (c,c2,c2,c?) 


são linearmente independentes. Generalize. 


9.10. Exiba uma base para a imagem de cada uma das transforma- 
ções lineares abaixo e determine seu posto. 





(a) ARS R?,Alxyzt)=(x+2y-t,2x-z+2t,—-2x+y +32) 


(b) B:ER* 5 Rº,B(x,y,z;t) = (x+2y+2z—t,2x+4y+3z+4t, 3x + 
2z+3t,-3x+z+6t, 10x +2y +5z2+5t) 











(0) C:RÊ SR, C(x,y,2) = (x +3y,2y +42,x +y — 42) 


(d) D: Pa > Pr, Dp(x) = p'(x). 


9.11. Use escalonamento para resolver os seguintes sistemas linea- 
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res: 

x + 3y + Zz = 

2x + 6y + Pz = 7 

2%. + O) + do = 6 

x + y pt = O 

x + 2W + z + t= 1 

o» Pay + E Zi s + 
+ 3 — t= 3 

x + yu -z+ 2H =o 
3y — z+ 3% = 0 

Bi y Ê t = b 





9.12. Ache uma condição envolvendo a, b, c para que o sistema 
abaixo tenha solução e encontre as soluções no caso em que elas 
existam 





XxX +Huyu + z+Ht = a 
by + da + = b 
Sm Mp E — = 


9.13. Ache uma base para o núcleo de cada uma das transformações 
lineares a seguir: 


(a) A:Rê > Rº, A(x,y,2z) = (—3y + 4z,3x — 52, —4x + 5y). 





(b) B:Rº 5 Rº, B(xy,zt) = (2x-2z+4t,x—22+3t,4y+2z+ 
t,6x+4y — 42 + 13t,2x+4y — 22 +71) 











(co) CRS Rê, Clx,y,z,t) = (2x+y—z+3t, x—4y+2z+t, 2y+42—). 
(d) T:P5P,T-pl)=plixtm), mo. 


9.14. Decida quais das matrizes abaixo possuem inversa e calcule a 
inversa quando existir. 


| 2 5 4 a 
12 123] [5678 RE] 
34) Lag) [PIO MAR] |3112 
dd 1213 
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9.15. Prove que o sistema 


x 
2x 
X% 





2y 
5y 
y 





32 — 3 
32 + 12t 
82 + 5 
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a 
b 
c 


admite solução se, e somente se, 3/a+13b = 9c. Ache a solução geral 


do sistema quando a=2eb=4. 


9.16. Prove que toda matriz anti-simétrica 3 x 3 não-nula tem posto 
igual a dois. Dê exemplo de uma matriz anti-simétrica invertível 


4x4, 


9.17. Considere o sistema de n equações lineares a n incógnitas: 


Xi +Xy = 


(= cs ti=1), 


X1 + Xn = Cp. 


(a) Sem é ímpar, prove que ele possui solução única, sejam quais 
forem os a;. Explicite esta solução. 


(b) Supondo n par, obtenha condições sobre os a; que sejam 
necessárias e suficientes para que o sistema possua solução. 
Caso existam soluções, determine a variedade afim por elas 


formada. 
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Produto Interno 


O produto interno, que já foi mencionado brevemente antes, na de- 
finição do produto de duas matrizes, será apresentado formalmente 
nesta seção e adotado sistematicamente a partir daqui. Trata-se de 
uma noção que completa e enriquece a estrutura de um espaço ve- 
torial, permitindo a utilização de uma linguagem geométrica alta- 
mente sugestiva e o destaque de tipos especiais de operadores, os 
quais admitem uma análise mais profunda de suas propriedades, 
como se verá a seguir. 


Os axiomas de espaço vetorial não são suficientes para abordar 
certas noções geométricas como ângulo, perpendicularismo, compri- 
mento, distância, etc. Isto se torna possível com a introdução de um 
produto interno. 

Um produto interno num espaço vetorial E é um funcional bi- 
linear simétrico e positivo em E. Mais precisamente, um produto 
interno é uma função E x E > R, que associa a cada par de veto- 
res u,v € E um número real (u,v), chamado o produto interno de u 
por v, de modo que sejam válidas as seguintes propriedades, para 
quaisqueru,u,v,vV €EFeaceR: 


Bilinearidade: (utu,v) = (uv) + (u”,v), (au,v) = a(u,v), 
(uv EV) E (u, v) Ar (u, v), (u, av) E a(u, v); 


Comutatividade (simetria): (u,v) = (v,u); 


Seção 10 Produto Interno 119 


Positividade: (u,u) >0seu Z0. 

Como (0,v) = (0+0,v) = (0,v) + (0,v), segue-se que (0,v) = 
(v,0) = 0 para todo v E E. 

Resulta da positividade que se (u,v) = O para todo v € E então 
u = 0. Com efeito, se fosse u * O teríamos (u,v) £ O pelo menos 
quando v=u. 

Segue-se desta observação que se u,u” € E são vetores tais que 
(u,v) = (u”,v) para todo v € E então u = u”. Com efeito, isto implica 
que (u—u',v) = 0 paratodove E logou—u =0eu=u”. 

O número não-negativo |ul = /(u,u) chama-se a norma ou o 
comprimento do vetor u. Com esta notação, tem-se |u/? — (uu) e a 
igualdade 


(u+vu+v) =(,uw-+(u,v) + (vu) + (vv) 


lê-se: tu +vP = |u? + yP+2(u,v). 

Quando |u| = 1 diz-se que u € E é um vetor unitário. Todo vetor 
u + O se escreve como u = |u|- u”, onde u” é um vetor unitário. Basta 
pôr u' = ju!.u. 


Exemplo 10.1. No espaço euclidiano R”, o produto interno canônico 
dos vetores u = (01,...,ân) ev = (By,...,Bn) é definido por (u,v) = 
oyBy +--- + anfBn. Este é o produto interno que consideraremos em 
R", salvo aviso em contrário. 


Exemplo 10.2. Consideremos R? como o modelo aritmético do plano 
euclidiano, no qual se introduziu um sistema de coordenadas carte- 
sianas. Dados u = («1,0x2) ev = (B1, B2), os números 


= 2 2 
tul= 4/03 + 05 
= 2 2 
lv| = V Bj + B5 


medem realmente os comprimentos das flechas que representam es- 
ses vetores. Suponhamos u £ 0,v £ O e chamemos de O o ângulo 
formado por essas flechas. Afirmamos que o produto interno (u,v) = 
«1 B1 + «22 acima definido é igual a lullv| cos 0. Isto será provado 
em três passos: 1º) Se os vetores u e v são perpendiculares, então 
(u,v) = 0 = lullvicos 90º. Com efeito, por um lado, 


lu+vP = (u+vu+v) = ju? + pf +2(u,v) 
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e por outro lado, pelo Teorema de Pitágoras, 


ju + vp = juP + vp. 





Figura 10.1. 


Logo (u,v) = 0. 2º) Se lu = |v| = 1 então (u,v) = cos 0. Com 
efeito, tomando o vetor unitário u* perpendicular a u temos, pela 
definição de seno e cosseno, v = cos O-u + sen O -u*. (Fig. 10.2.) 


* 
u v 


Figura 10.2. 


Tomando o produto interno de ambos os membros desta igualdade 
por u vem (u,v) = cos 0: (u,u) + sen O - (u,u*). Como (u,u) = 1 e 
(u,u*) = O pelo primeiro passo, temos (u,v) = cos 0. 3º) Caso ge- 
ral: pomosu = |ul.u'ev = |v|-v, onde u' = (1/jujuev' = (1/|v))v são 
vetores unitários. Então (u,v) = lul|v| (u”,v) = lullvicos 0. Vemos, 
em particular, que os vetores u, v formam um ângulo agudo quando 
(u,v) > 0, um ângulo obtuso quando (u,v) < O e um ângulo reto 
quando (u,v) = 0. 
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Exemplo 10.3. Seja E = Cº([a, b]) o espaço vetorial cujos elementos 
são as funções contínuas g,f: [a,b] > R. Um produto interno em E 
pode ser definido pondo 


b 


(8,9) -| Fo)g(x) dx. 


a 


Neste caso, a norma da função f é 


b 
fl = | f(x)? dx. 


Este produto interno é utilizado no estudo das séries de Fourier. 


Observação. Seja E um espaço vetorial de dimensão finita arbitrá- 
rio. Dada uma base (m,...,un) C E, podemos definir um produto 
interno em E pondo, para u = Lau ev = LB;u;, (u,v) = Lai, 
por definição. Isto mostra que todo espaço vetorial de dimensão fi- 
nita pode ser munido de um produto interno. (Fato verdadeiro em 
geral, pois qualquer espaço vetorial possui base, mas não entrare- 
mos nesse terreno.) Assim, quando nos referirmos a um espaço mu- 
nido de um produto interno, não estaremos com isso atribuindo uma 
propriedade especial a esse espaço mas apenas dizendo que, entre 
os possíveis produtos internos que nele podem ser introduzidos, um 
particular foi escolhido e fixado. 


Seja E um espaço vetorial com produto interno. Dois vetores 
u,v € E chamam-se ortogonais (ou perpendiculares) quando (u,v) = 
0. Escreve-se, então, u | v. Em particular, O é ortogonal a qualquer 
vetor de E. Um conjunto X c E diz-se ortogonal quando dois vetores 
distintos quaisquer em X são ortogonais. Se, além disso, todos os ve- 
tores de X são unitários então X chama-se um conjunto ortonormal. 
Portanto, o conjunto X C E é ortonormal se, e somente se, dados 
u,v E Xtem-se (u,v) =0OseuZve(u,v) =] sev=u. Uma base 
ortonormal é uma base de E que é um conjunto ortonormal. 


Teorema 10.1. Num espaço vetorial E com produto interno, todo 
conjunto ortogonal X de vetores não-nulos é L.I.. 
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Demonstração: Sejam v1,...,vn € X. Temos (v;,v;)) = O sei Lj. Se 
eqvi + --- + anvn = O é uma combinação linear nula desses vetores 
então, para cada i = 1,2,...,n, tomamos o produto interno de ambos 


os membros desta igualdade por v; e temos 
o (vv) ++ on (Mv) —0, 


logo a; (vivi) = civil? = O pois todos os produtos internos (Vi, Vi), 
com j £ i, são nulos em virtude da ortogonalidade de X. Além disso, 
como os vetores pertencentes ao conjunto X são todos não-nulos, re- 
sulta de a;lv;/? = O que «; = O. Assim, os coeficientes da combinação 
linear Lw;v; = O são todos iguais a zero e os vetores do conjunto X 
são, portanto, linearmente independentes. 














Exemplo 10.4. A base canônica (ey,...,en) CR” é ortonormal: tem- 
se (e;,e;) = d;, onde d; = Osei£jeôd;=1 sei=j. No plano R? os 
vetoresu = (1,])ev=(—1,1) são ortogonais. Pondo 


(vã vê V(N2 vã 
ER dd q 


o conjunto (u”,v) C Rº é uma base ortonormal. 

Quando u e v são ortogonais, a igualdade ju + v2 = |ul? + |v2 + 
2(u,v) se torna |u + v? = |u/? + |vP. Esta é a versão do Teorema de 
Pitágoras para um espaço vetorial com produto interno. 

Num espaço vetorial E com produto interno, seja u um vetor 
unitário. Dado qualquer v € E, o vetor (u,v) -«u chama-se a projeção 
ortogonal de v sobre o eixo que contém u. À justificativa para esta 
denominação está no fato de que, escrevendo w = v— (u,v)u, tem- 
sev = (u,v)u + w, onde w é perpendicular a u. Com efeito, to- 
mando o produto interno de u por ambos os membros da igualdade 
w=v-—(u,v)u tem-se 


(u, w) = (UV) E (U, v) (u, u) = (u, v) E (u, v) =0, 


pois (u,u) = 1. (Fig. 10.3) 
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(Uuvu 


Figura 10.3. 


Quando se tem apenas u < 0, o eixo que contém u é o mesmo 
que contém o vetor unitário u' = u/jul (= [u/”! .u). A projeção or- 
togonal de v sobre este eixo é, portanto, igual a (u”,v) u”, ou seja, 
((u,v) /(u,u)) -u. Usaremos a notação 


(1,v) | 





O a) 
para indicar a projeção ortogonal do vetor v sobre o eixo que contém 
o vetor não-nulo u. 

Se z = pr,(v), tem-sev = z+w, com w 1 z. Pelo Teorema 
de Pitágoras, |v? = |z? + |w/. Em particular vemos que |z| < |, 
isto é, o comprimento da projeção pr, (v) é menor do que ou igual ao 
comprimento de v. 

Ora, a norma do vetor pr,,(v) é igual a | (u,v) |/lul. Segue-se então 
que, para quaisquer u,v € E, tem-se | (u,v) |/|ul < |vl, ou seja 


Hu,v) | < ul: |V (desigualdade de Schwarz). 


À rigor, o argumento acima prova a desigualdade de Schwarz 
apenas no caso em que u < 0. Mas ela é óbvia no caso em que u = 0. 
Logo vale em geral. 

Um importante complemento da desigualdade de Schwarz é que 


vale a igualdade |(u,v) | = |ul|v| se, e somente se, um dos vetores 
u, v é múltiplo do outro. Isto resulta do raciocínio acima pois, no 
Teorema de Pitágoras |v? = |z|2 + Iw/, dizer |v| = |z| significa que 


w =0, isto é, que v é múltiplo de u. 
Resulta da desigualdade de Schwarz que num espaço vetorial 
com produto interno a norma satisfaz a desigualdade triangular: 


lu +v| < jul + [vl. 
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Como se trata de números não-negativos, para provar esta desigual- 
dade basta mostrar que |u +v/ < (jul + |v|)2. Ora, 


ju+vf=tu+v,us+v) 
= tu? +hpP+2(u,v) 


< fu? + |vÊ + 2hulp/ 








2 
= (jul + Iv”, 


pois (u,v) < |ul[v| pela desigualdade de Schwarz. 

Vale a igualdade [u+v| = |u|-+|v| somente quando um dos vetores 
u, v é um múltiplo não-negativo do outro. Com efeito, pelo argu- 
mento acima, |u + v| = [ul + |v| ocorre quando (u,v) = |ul|v|, o que 
é óbvio quando u = O e implica v = «u quando u £ 0. Neste caso, 
lullvi = (u,v) = «(u,u) — ajuf?, logo « > 0. 

Além da desigualdade triangular, a norma goza ainda das se- 
guintes propriedades, de imediata verificação: 


lul>0 se uz0 e la-u/=lalful. 


Em particular, |— ul = Jul. 


Observação. Em todo este livro, la] significa o valor absoluto do 
número « e |ul representa também a norma do vetor u. 

Num espaço vetorial E munido de produto interno, a distância 
entre os vetores u, v é, por definição, d(u,v) = |u — v|. Tem-se 
d(u,u) = 0, dlu,v) > 0 seu £v, d(u,v) = d(v,u) e d(u,w) < 
d(u,v) + d(v,w). 

Mostraremos agora que existem bases ortonormais em todo es- 
paço vetorial de dimensão finita provido de um produto interno. 

Mais precisamente, exporemos o processo de ortonormalização 
de Gram-Schmidt, um algoritmo que ensina a passar de uma base 
qualquer (vj,...,vn! C E para uma base ortonormal (w,...,un) CE, 
com a importante propriedade de que, para m = 1,...,n, os vetores 
U7,..., Um pertencem ao subespaço Fm, gerado por vy,...,Vm- 

Dada a base (vy,...,vn) E E, obteremos primeiro uma base or- 
togonal (w;,...,wn) EC E e depois poremos wu, = w,/|wil,...,Un = 
Wn/|wn| para chegar à base ortonormalizada (uy,...,un) E E. 

Começamos o processo tomando w; = v; e prosseguimos por 
indução. Suponhamos já obtidos os vetores não-nulos w1,...,Wm, 
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dois a dois ortogonais, gerando o subespaço Fm, o mesmo que é ge- 





rado por vj,...,Vm- Definimos wm..1 pondo 
m 
— (Wi Vim) 
W mt = VYVmH DB. Wi. 
(wi, Wi) 


i=l 











b 
. e ai — (wiv3) DO AW25v3) 
Figura 10.4. w3 = v3 — 23,23 = TR piu Ve 

Um cálculo simples mostra que wm1 é ortogonal a wy,...,Wm. 
Além disso, Wm+1 É O porque vm:1 não pertence ao subespaço Fm 
gerado por w1,...,Wm (ou por vy,...,Vm). E, finalmente, wm:1 per- 
tence ao subespaço gerado por (w1,...,Wm,Vm+1), O qual é igual a 
Fm1. Isto completa o processo. 

Observamos que se os primeiros m vetores da base (vi,...,Vn) E 


E já formarem uma base ortonormal do subespaço por eles gerado 
então o processo de Gram-Schmidt transforma essa base numa base 
ortonormal (u,..., un! C E na qual u, = V1,...,Um = Vm- 

Segue-se daí que, dado um subespaço vetorial F € E, toda base 
ortonormal de F estende-se a uma base ortonormal de E: basta es- 
tendê-la a uma base qualquer de E e depois ortonormalizar esta 
última por Gram-Schmidt. 

O significado geométrico do processo de Gram-Schmidt é bas- 
tante simples e fica ilustrado na figura: se (w1,...,Wm) C F é uma 
base ortogonal então, para todo v € E, o vetor 

m 
Zi= Av) wi E F 


= (wi Wi) 
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soma das projeções ortogonais de v sobre os eixos dos w;, tem a pro- 
priedade de que w = v — z é perpendicular aos vetores w1,...,Wm. 
Daí resulta imediatamente que w é perpendicular a todos os vetores 
de F, pois esses vetores são combinações lineares dos w;. O vetor z 
chama-se a projeção ortogonal de v sobre o subespaço F. Escreve- 
se z = prr(v). (Fig. 10.5.) [Para a fórmula de prç(v) quando a base 
(w7,...,Wm: EC Fnão é ortogonal, veja os Corolários 1 e 2 do Teorema 
16.1 ou o Exercício 16.7.] 


v 





Figura 10.5. 


Se z' é qualquer outro vetor em F, temos 
vegslp-zgs (ag). 


Como z — z' E F, segue-se que (v — z) | (z— z'). Do Teorema de 
Pitágoras resulta então que |v—z'2 = y—z?2 +|z—z'P. Em particular, 
v—z| > |v—zl. Isto mostra que a distância de v à sua projeção 
z = pry(v) sobre o subespaço F é menor do que ou igual à distância 
de v a qualquer outro vetor 7” E F. Noutras palavras, a projeção 
z = prr(v) é o vetor mais próximo de v no subespaço F. 

Se [u1,...,Um) C F é uma base ortonormal então a projeção orto- 
gonal de um vetor v E E sobre o subespaço F se exprime, de forma 
mais simples, como 


m 


pre(v) = Do (Ui V) Us 


i—] 


Isto está de acordo com a seguinte observação geral: 
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Seja (11,..., Un) C E uma base ortonormal. Para todo vetor v E E 


tem-se 
n 


== . (ui, v) “Ui. 
i= 


Com efeito, v se exprime como combinação linear 
v= Qu ++ amu 


em termos da base dada. Tomando o produto interno de ambos os 
membros desta igualdade por u;, temos (u;,v) = «q (i=1,...,n) 
pois (u,u;) =ôy (= Isei=je=Oseifj). 

Assim, as coordenadas de um vetor relativamente a uma base 
ortonormal são os produtos internos desse vetor pelos elementos da- 


quela base. 
Seu — Lou ev — >B;u; são as expressões dos vetores u,v € 
E em termos de uma base ortonormal (u,,...,un) E E, as relações 


(ui; u;) — 6; implicam imediatamente que 
n 
(1 KU; = Bju; = a ais ( Ui, UG) - miBi. 
j=1 ij=1 

Portanto, quando se referem os vetores de E a uma base ortonormal 
fixada, o produto interno assume a forma (u,v) = Lo;fi;, análoga à 
do produto interno canônico de R?. 

Tomando, mais geralmente, uma base arbitrária (vi,...,Vn) C E 
e pondo (vi, v;) — giz, O produto interno dos vetores 


u=5 am e E 


j=1 


se exprime como 


-» Ii QB. (5) 
Lj=1 
A matriz g = Ig;l € M(n x n) é simétrica, isto é, g; = 9j pois 
(vivi) — (vi vi). Mais ainda: a matriz g é positiva. Isto significa 
que, além de g ser simétrica, para qualquer lista (x1,...,xn) dem 
números reais não todos nulos, tem-se 


n 
z. Tij XX; > 0. 


Lj=] 
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Reciprocamente, fixada uma base (vi, ..., vn) num espaço vetorial 
E (que pode ser, por exemplo, a base canônica em R?) e dada uma 
matriz simétrica positiva g — [g;] € M(n xn), a igualdade (*) acima 
define um produto interno em E. 


Exercícios 


10.1. Seja E um espaço vetorial com produto interno. Para quaisquer 
vetores u,v € E, prove que [ulv + |vlu e |ulv — Iv|u são ortogonais. 


10.2. Seja (u1,...,un; C E uma base ortonormal. Prove que, para 
n 


v,w € E arbitrários, tem-se (v,w) = > (v,uy) (w, ui). 


i=] 

10.3. Dado o vetor u = (2,3,6), seja P:Rº — Rº o operador linear 
definido por Pv = pr, (v). Descreva I — 2P geometricamente, escreva 
a matriz da reflexão H = I— 2P e determine o vetor que se obtém de 
w = (1,1,1) por reflexão em torno do plano perpendicular a u. 


10.4. Considere a base V = ([vy,v2,v3] C Rº, formada pelos vetores 
vi = (1,1,1),v7 = (1,—1,1) e vz = (1,—1,—1). Determine a matriz 
de passagem p, de V para a base ortonormal U = (w, uz,us), obtida 
de V pelo método de Gram-Schmidt. Observe que os elementos da 
diagonal de p são números positivos e abaixo da diagonal todos são 
nulos. Generalize. 

10.5. Seja V = [vi,...,vn) C Rº uma base, com v; = (&1;, 02;,..., 
«,Xnj), j — 1,...,n. Seja U a base ortonormal de R” obtida de V 
pelo processo de Gram-Schmidt. Prove que U é a base canônica de 
R” se, e somente se, q; — O para todo i > je ai; > O para todo 
pd PR 

10.6. Sem fazer cálculo algum, diga quais são as bases obtidas de 
V = (vi, v2,v3) pelo processo de Gram-Schmidt nos seguintes casos: 


(a) VI =— (3,0,0), Vop= [=1,3,0),18 = (2,5, 4 
(b) vi = (—1,1,0), vz = (5,0,0), v3 = (2,—2,3). 


10.7. Dado o vetor unitário u = («1,...,Ô0n) E R”, forme a matriz 
a = [x -o] e M(nxnmn). Seja H:R”" > R” o operador cuja matriz 
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na base canônica é 1, — 2a. Mostre que para todo v E R” tem-se 
Hv=v-—2(v,u)u e conclua que |Hv| = |v]. 


10.8. Num espaço vetorial com produto interno, o ângulo entre dois 
vetores não-nulos u, v é, por definição, o ângulo O = s(u,v), tal que 
O<0<180ºecos0 = (u,v)/ullv|. Dito isto, e dados os vetores 
u=(39,v=(1,-1))ew = (—1,1), ponha em ordem crescente os 
ângulos Xu,v), Mu,w) e Hv,w). 


10.9. Sejam u,v € Rº vetores L.I.. Prove que o vetor |ulv + |v|u está 
contido na bissetriz do ângulo formado por u e v. 


10.10. Seja u = (a,b,c) E Rº um vetor unitário, com abc 0. Deter- 
mine t de modo que, pondo v = (—bt,at,0) ew = (act, bet, —1/1), os 
vetores u, v, w sejam unitários e dois a dois ortogonais. 


10.11. Para cada par de vetores u = (x,y), v = (x',y') em Rº, ponha 
[u,v) = 2xx' — xy' — xy + 2yy”. Prove que isto define um produto 
interno no espaço vetorial Rº. 


10.12. Dado o produto interno (u,v) no espaço vetorial E, prove que 
se tem ju+v? +|u— v? = 2(lu/? + |vP) para quaisquer u,v E E. 
Interprete esta igualdade geometricamente. 


10.13. Seja X um conjunto de geradores do espaço vetorial E, onde 
está definido um produto interno. Se os vetores u,v € E são tais que 
(u,w) = (v,w) para qualquer w € X, prove que u =v. 


10.14. Seja (vi,...,vn) uma base no espaço vetorial E, munido de 
produto interno. Dados n números reais arbitrários «y,..., An, prove 
que existe um, e somente um, vetor w € E tal que 


7 == Dias (AM = Rr 


10.15. Para toda base V = (vy,...,vn/ no espaço vetorial E, dotado de 
produto interno, prove que existe uma única base W = (wy,...,Wn) 
Cc Etal que (w,v) = dy (1,j) = 1,2,...,n). Se (vv) = we 
(Wi Wj) = bj, prove que as matrizes a — [a;] e b — [b;] são inversas 
uma da outra. 


10.16. Suponha que 
Te 
[u,v] = Do AjXiU 


ij=1 
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defina, para u = (x1,...,Xn) ev = (y1,...,yn), um produto interno 
em R”. Prove que aj >0,...,am > 0. 

10.17. Calcule três produtos internos entre os vetores u = (1,0,—1), 
v = (4,1,4), w = (-3,24,-3) e conclua que eles são linearmente 
independentes. 


10.18. Em cada um dos casos abaixo, determine se o conjunto 
(u,v, wi C Rº é ortonormal, apenas ortogonal ou nenhum dos dois. 


(a) u= (1,2,1),v = (1,—1,D),w = [= 12). 
(b) u=(a,b,c),v= (-b,a,0), w = (—ac,—be, a? + b?). 


(0) u=1(2,6,3),v = 4(3,2,-6), w = 1(6,-3,2). 


10.19. Seja (, ) um produto interno no espaço vetorial F. Dado 
um isomorfismo A: E > F, ponha [u,v] = (Au, Av) para quaisquer 
u,v € E. Prove que |, | é um produto interno em E. 


10.20. Dados os vetoresu = (2,-1,2), v=(1,21)ew=(-2,3,3), 
determine o vetor de Rº que é a projeção ortogonal de w sobre o plano 
gerado por u ev. 


10.21. Qual é a base ortonormal de Rº obtida pelo processo de Gram- 
Schmidt a partir da base (u,v,w), onde u = (2,6,3), v = (-5,6,24) e 
w=(9,—1,-4)? 


10.22. Mesma pergunta do exercício anterior para u = (3,4,12), 
v=(7,-8,15)ew = (—15,6,44). 


10.23. Para todo número natural n, prove que a norma do vetor 
v=(n,n+41,n(n+41)) ER? é um número natural. 


10.24. Aplicando o processo de Gram-Schmidt a um conjunto de 
vetores vj,..., Vm cuja independência linear não é conhecida, prove 
que se obtém o primeiro vetor w,,1 = O quando v;,...,v, são L.I. 
mas v,;1 é combinação linear de vi,...,Vr. 


10.25. Fixado o vetor unitário u = (m,...,an) E R?, seja PER? > 
R” o operador linear definido por Pv = pr, (v) = projeção ortogonal 
de v sobre o eixo de u. Mostre que P? = P, determine o núcleo de 
P, as matrizes de P, deI — P e da reflexão ortogonal H = I— 2P em 
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torno do núcleo de P. (A matriz de H é conhecida como uma matriz 
de Householder.) 


10.26. Seja a um vetor não-nulo no espaço vetorial E, de dimensão 
n, munido de produto interno. Para todo b E R, prove que o conjunto 
V=(ve E (v,a) = b) é uma variedade afim de dimensão n— 1. Dado 
vo € V, mostre que v € V se, e somente se, v — vo é ortogonal a a. 


10.27. Sejam u = (x1,x2,x3) e v = (yj,y2,U3) vetores em Rº. O 


produto vetorial de u por v é definido como o vetor 


Uxv= (xy x3U2,X3Y1 — X1U3, XIY2 — X2y1). 
Prove que valem as seguintes propriedades: 


(a) uxv=—vxu; 
b)ux(v+tv)=uxvtuxv; 

(co) ux (av) = a(u x v); 

(d) ux v — O se, e somente se, ue v são L.D.; 
(e) ux véortogonalaue a v; 


Derosttoro tere db: 


[Mais detalhes sobre o produto vetorial no livro “Coordenadas no 
Espaço”, do autor, publicado pela Soc. Bras. de Mat.] 


10.28. Sejar = ((1—- tju+tv;t e RJ a reta que liga u a v em E, com 
uv. Dado w € E, prove que, tomando t = (w— u,v— u) /|jy— uP 
obtém-se o ponto x = (1 — t)Ju + tv de r mais próximo possível de w, 
ou seja, tem-se |x — w| < |y — w| para qualquer outro ponto y € 1. 


10.29. Seja U = (u,,...,un) €C E uma base no espaço vetorial E, 
munido de produto interno. Suponha que, para todo v = xyuy + 
“+ xnim E E se tenha |v? = o +---+x2. Prove que a base U é 
ortonormal. 


10.30. Complete os detalhes do seguinte argumento que prova a 
existência de uma base ortonormal em qualquer espaço vetorial E, 
de dimensão n, com produto interno: “Seja U = (w,..,uw) C E 
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um conjunto ortonormal com o maior número possível de elementos. 
Para todo vetor v € E, o vetor 


r 


w=v—3 (yu) 


i=] 


é ortogonal a w,...,u,. Pela maximalidade de 4, tem-se w = 0, logo 
U gera E e é uma base ortonormal.” 


10.31. Seja E um espaço vetorial com produto interno. Prove que, 
para quaisquer u,v € E, tem-se | Jul — |v|| < ju — v]. 


10.32. Prove que um operador A: E — E, num espaço vetorial de 
dimensão finita com produto interno, tem posto 1 se, e somente se, 
existem vetores não-nulos a,b € E tais que Av = (v,a) b para todo 
v € E. (Compare com o Exercício 8.27.) 


10.33. Num espaço vetorial E com produto interno, o cosseno do 
ângulo entre dois vetores não-nulos u, v é definido como cos(u,v) = 
(u,v) /lullvl. Prove que seu e v são ortogonais e não-nulos então 
cos?(u,u—v)+cos?(v,u—v) = 1. (A soma dos quadrados dos cossenos 
dos ângulos agudos de um triângulo retângulo é igual a 1.) 


10.34. Sejam E um espaço vetorial com produto interno, C c E um 
conjunto convexo e a E E um ponto fora de C. Suponha que exis- 
tam x,,x1 € € com a seguinte propriedade: para todo x E C tem-se 
la-xo|<|la-xlela—-x| <|a—x]. Prove que xo = X1. 


H 


A Adjunta 


Mostraremos, nesta seção, como o produto interno nos permite asso- 
ciar a cada transformação linear A: E — Fuma nova transformação 
A*: F > E chamada a adjunta de A. (Em espaços sem produto in- 
terno também existe uma noção de adjunta, mas aí se trata de uma 
transformação linear F* — E*, do dual de F no dual de E. O produto 
interno nos dá condição de permanecer com E e F. Isto é particu- 
larmente interessante no caso de um operador linear A: E > E) À 
adjunta nos dá, por assim dizer, uma visão da transformação A sob 
um novo ângulo. Essa mudança de ponto de vista é reveladora, espe- 
cialmente quando ocorre a existência de relações entre A e A+. 


Sejam dim E =n e dim F = m. Vimos na Seção 8 que a escolha 
de bases em E e F determina um isomorfismo q: L(E;F) > M(m x 
n), portanto o espaço vetorial L(E;F) das transformações lineares 
de E em F tem dimensão mn. Em particular, o espaço E* = L(E;R) 
cujos elementos são os funcionais lineares f: E > R, chamado espaço 
dual de E, tem dimensão n. Isto implica que E* é isomorfo a E. 
Na realidade, dada uma base V = (vi,...,Vn) E E, existe uma base 
V* = (v,...,vA) C E*, chamada base dual de V, onde, por definição, 
para cada vetor v = Lojv; € E, tem-se vi(v) — a;. (A verificação 
de que V* c E* é uma base pode ser feita diretamente ou então 
mediante a observação de que q(vi) — e; — i-ésimo elemento da 
base canônica de R”, onde q: E* >» M(l xn) = R” é o isomorfismo 
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acima mencionado.) Obtém-se um isomorfismo A: E — E* impondo 
que Avi=4 (1 = st). 

Uma desvantagem dos isomorfismos entre E e E* obtidos medi- 
ante o emprego de uma base é que eles não são intrínsecos: dado um 
vetor v € E, o funcional v* E E* que a ele corresponde depende não 
apenas de v mas também da base de E que se tomou. Esta dificul- 
dade, entretanto, desaparece quando E está munido de um produto 
interno, como veremos agora. 

Seja E um espaço vetorial de dimensão finita, dotado de um pro- 
duto interno. Definimos uma transformação linear E: E > E* fa- 
zendo corresponder a cada vetor v € E o funcional linear E .v = v*, 
tal que v*(w) = (w,v) para todo w € E. 

A verificação da linearidade de E é imediata: se u,v € E, como 


(u + vw) = (wu +v) = (w,u) is (W, v) 
= u"(w) +v*(w) 


= [u* + v(w) 


para todo w € E, temos (u + v)* = u* + v*. Analogamente, (av)* = 
xe vA. 

Além disso, E é injetiva. Com efeito, dado v E E, se v* = O então, 
para todo w € E tem-se 


(w,v) = v*(w) = 0(w) = 0. 


Em particular, (v,v) = 0, logo v = 0. 

Finalmente, &: E — E* é sobrejetiva pois é injetiva e os espaços 
E, E* têm, como vimos, a mesma dimensão. 

Assim, podemos enunciar o 


Teorema 11.1. Seja E um espaço vetorial de dimensão finita, com 
produto interno. A correspondência E: E — E* que associa a cada 
v E Eo funcional linear E(v) = v*, tal que v*(w) = (w,v) para todo 
w € E, é um isomorfismo. 


O teorema acima será usado principalmente na medida em que 
assegura a existência de E !. Mais explicitamente: a todo funcional 
linear f: E — R corresponde um único vetor v = v; € E tal que 
(w,v) = f(w) para todo w E E. Um tanto informalmente: para se 
conhecer um vetor v € E basta que se conheça o produto interno de 
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todos os vetores w E E por v (desde que esses produtos dependam 
linearmente de w). 

O Teorema 11.1 é responsável pelo pouco (ou nenhum) uso que 
se faz de funcionais lineares em espaços, como R”, onde há um pro- 
duto interno: funcionais são substituídos por vetores e a ação de um 
funcional sobre um vetor é substituída por um produto interno. 

De posse do Teorema 11.1, definiremos a adjunta de uma trans- 
formação linear A: E — F onde E, F são espaços vetoriais de di- 
mensão finita, ambos munidos de produto interno. 

A adjunta de A deve ser uma transformação linear A*: F> Etal 
que, para v € Ee w € F quaisquer se tenha: 


(Av,w) = (v, A*w). (8) 


Assim, a imagem A*w E E de um vetor arbitrário w € F é, por 
definição, aquele vetor de E tal que o produto interno de qualquer 
vetor v € E por ele é igual a (Av,w). Como, para cada w E F, o 
número f(v) = (Av,w) depende linearmente de v (ou seja, f é um 
funcional linear), o Teorema 11.1 assegura que o vetor A*w E E 
existe e é único de modo que valha (*) para quaisquer v € E, w € F. 
A correspondência w — A*w assim definida é uma transformação 
linear de F em E. Com efeito, dados w,w' E F tem-se, para todo 
veE: 


(v,A*(w + w)) = (Avw +w) = (Av,w) + (Av,w) 
= (v,A'w) + (v,A'w) = (v,A'w + At'w). 


Assim, A*(w + w') e A*w + A*w' são vetores em E cujos produtos 
internos por qualquer vetor v € E são iguais. Portanto A*(w + w”) = 
Atw + Atw'. De modo análogo se verifica que A*(uw) = «- Atw. 
Assim, A* E L(F;E). 

A transposta de uma matriz a — [a;l € M(m x n) é a matriz 
a! = [a;;] e M(n x m) que tem como linhas as colunas de a e como 
colunas as linhas de a, na mesma ordem. 


Teorema 11.2. Sejam U =(w,.. sun) CEeV=(vo..svm) CF 
bases ortonormais. Se a — la;]l € M(m xn) é a matriz da trans- 
formação linear A: E > F nas bases U, V então a matriz da adjunta 
At:F > E nas bases V, U é a transposta a! = la) e M(nxm) 
de a. 


186 A Adjunta Seção 11 


Demonstração: Por definição de matriz de uma transformação li- 
near, temos 


m 
Au => av; G=1,...,n) 
i—] 


Tt 
* 
Avi = ) bat, 
r=1 


onde b — [bi] e M(n x m) é a matriz de A* nas bases V, 4, a ser 
determinada. Como ambas as bases são ortonormais, temos, para 
cadai=1,...,mecadaj=1,...,n: 


bi — (Uj, Avi) =— (Auj, Vi) =— Qi; 











portanto, b = a!, transposta de a. 





Corolário. Uma transformação linear A e sua adjunta A* têm o 
mesmo posto. (Vide Teorema 8.2.) 


É apresentada a seguir uma lista de propriedades operacionais 
da adjunta de uma transformação linear, as quais se traduzem em 
propriedades da transposta de uma matriz, via Teorema 11.2. A va- 
lidez dessas propriedades decorre da observação de que duas trans- 
formações lineares A,B: E — F são iguais quando se tem (Au,v) = 
(Bu,v) para quaisquer u € E, v E F. 


P=I (EL)! = 
(A+B)*= A*+ B* (a+b)! =a! 4+b! 
(xA)* = «A* (xa)! = qa” 

(BA)* = A*B* (ba)' = a!b! 

A = A (al! -a 


Se A: E > F é uma transformação linear injetiva então existe 
B:F > Etal que BA = Ig (vide Teorema 6.5). Tomando a adjunta 
de ambos os membros desta igualdade, temos A*B* = IE. Assim 
A*: F > E possui uma inversa à direita B*, logo é sobrejetiva. (Te- 
orema 6.1.) Do mesmo modo se vê que A sobrejetiva implica A* 
injetiva. Portanto a adjunta de um isomorfismo A: E > F é um iso- 
morfismo A*: F — E. Além disso, de A“!A = Ip resulta A*(A-!)* = Ik 
logo (A*) 1 = (A+. 
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Analogamente, uma matriz quadrada a é invertível se, e somente 
se, sua transposta a! é invertível e, no caso afirmativo, (a!) ! = 
far. 

As noções de retas e planos perpendiculares da Geometria Ele- 
mentar se estendem em Álgebra Linear ao conceito de complemento 
ortogonal, o qual ajuda a entender as relações entre uma transfor- 
mação linear e sua adjunta. 

Seja E um espaço vetorial com produto interno. O complemento 
ortogonal de um conjunto não-vazio X C E é o conjunto X! formado 
pelos vetores v E E que são ortogonais a todos os vetores x E X. 
Portanto 

vexisS (vx)=0 paratodo xe X. 


e Dado X c E, temos (0,x) — O para todo x € X, logo O e X-. 


e SeveXleaceR então (av,x) — «(v,x) — O para todo x E X, 
portanto av E X-+. 


e SeucXl eve X! então, para todo x E X, tem-se (u +v,x) = 
(u,x) + (v,x) = 0, logo u +v E XX. 


Segue-se das três observações acima que o complemento ortogo- 
nal de qualquer conjunto não-vazio X € E é um subespaço vetorial 
de E. 

Evidentemente, XCY>YlcXleveXnXxi=sv=0. 

Além disso, se v é ortogonal aos vetores x1,..., xm então v é orto- 
gonal a qualquer combinação linear La;jx;, pois 


(» >. ox) = Do mn =o. 


Daí resulta que o complemento ortogonal X+ do conjunto X coincide 
com o complemento ortogonal S(X)! do subespaço vetorial S(X), ge- 
rado por X. 


Exemplo 11.1. Tem-se (0! = Ee E! = (0). SeF c R” é o subespaço 
vetorial gerado pelo vetor não nulo v = (a,...,an) (reta que passa 
pela origem), o complemento ortogonal F* é o hiperplano definido 
pela equação ax; +---+ anXxn = 0. 


Teorema 11.3. Seja E um espaço vetorial de dimensão finita, mu- 
nido de produto interno. Para todo subespaço vetorial Fc E tem-se a 
decomposição em soma direta E= Fo. 
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Demonstração: Seja (u1,...,un; €C E uma base ortonormal cujos 
primeiros m elementos uy,...,um formam uma base (ortonormal) 
de F. (Começa-se com uma base qualquer de F, estende-se-a a uma 
base de E e depois aplica-se Gram-Schmidt.) Para todo vetor v E E 
tem-se v = quj+---+Ôanun = z+w, onde z = «uy +---+ &mUm E F 
ew = Gmiilma + --- + anun E Fl. Portanto E = F+ Fl. Como 
EnFl = (0), segue-se que E=F&F. 














Corolário 1. dim F + dim F+ = dim E. 
Corolário 2. Para todo subespaço vetorial FCE, tem-se (F-)! = F. 


Com efeito, seja qual for o conjunto não-vazio X C E, vale a in- 
clusão X c (X!)t. Em particular, o subespaço F está contido em 
(F-)+. Do Corolário 1 resulta que 


dim(F!)! = dim E — dim Fi = dim E — (dim E — dim F) = dim F. 














Logo F= (FS. 


Vimos na Seção 10 que a projeção ortogonal de um vetor v E E 
sobre um subespaço F C E é, por definição, o vetor 


z=prl) =) Let a, 


= (Wi, Wi) 
onde (w1,...,Wm) E F é uma base ortogonal. Vimos ainda que, pondo 
w=v-—z, temos v =z+w, com z € Few perpendicular a todos os 
wi (i=1,...,m), logo w € Fl. Ficou no ar a questão de saber até 
que ponto o vetor z = prr(v) depende da escolha da base ortogonal 
(wy,...,Wm) C F. A resposta é dada pelo Teorema 11.3. Como E = 


Fé Fl, é única a maneira de escrever um vetor v E E como soma 
v=z+w de um vetor z € F com um vetor w E Fl. Isto mostra que 
z = prr(v) não depende da escolha dos w;. (Veja também o Exercií- 
cio 11.5.) 

De agora em diante, indicaremos com a notação Pr: E > E, ou 
simplesmente P: E — E, quando não houver perigo de confusão, a 
projeção associada à decomposição E — Fo F-, a qual chamaremos a 
projeção ortogonal sobre F. 
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Teorema 11.4. Dada a transformação linear A: EF, entre espaços 
vetoriais de dimensão finita munidos de produto interno, tem-se 


N(A*) = Tm(A), 

Im(AM) = N(A)L, 
N(A) =Im(A*)* e 
Im(A) = N(A*)L 


Demonstração: Basta provar a primeira dessas igualdades; as de- 
mais se seguem dela usando A** = A e Fil =F. Ora, 


veM(A)SAtv>=0S(u,A*v) =Oqas. vcEsS 
o (Au,v) =Oqas veEóSve Im(A)-. 














Corolário 1. 4 fim de que o sistema de m equações lineares com n 


incógnitas 

n 

É agr =b; fts 1,..sm) 

j=1 
possua solução é necessário e suficiente que o vetor b = (by,...,bm) E 
R” seja perpendicular a toda solução y = (y1,...,Um) do sistema 


homogêneo transposto 


m 
> ay = 0 (i= Doses) 
j=1 


Com efeito, pela última das igualdades do Teorema 11.4, o sis- 
tema Ax = b tem solução se, e somente se, b é ortogonal ao núcleo 
de A*, isto é, a todas as soluções y E R” do sistema homogêneo 
Ay l 














O ponto do Corolário 1 é que ele permite concluir a existência de 
soluções sem que seja necessário exibir uma delas. 


Corolário 2. O posto de A* é igual ao posto de A. 
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Com efeito, se dim E = n então dim N'(A) + dim Tm(A) =, logo 


dim Tm(A*) =n — dim N'(A) 
=n-— [n— dim Zm(A)] 
= dim Tm(A). 














Esta prova do Corolário 2 é uma alternativa para o corolário do 
Teorema 11.2 sem o uso de matrizes. 

Na Fig. 11.1, os pares de retas perpendiculares representam pa- 
res de subespaços, cada um dos quais é o complemento ortogonal do 
outro. 


























E NA) F NAS) 

A 

+ 
A* 

< Tm(A) 

Tm(AS) 
Figura 11.1. 
Exercícios 


11.1. Seja A: E > F uma transformação linear entre espaços veto- 
riais de dimensão finita, munidos de produto interno. Prove: 


(a) Se À é sobrejetiva então AA*: F > F é invertível e 
A*(AA*) |: F > E é uma inversa à direita de A. 


(b) Se A é injetiva então A*A: E — E é invertível e (A*AJ I A* é 
uma inversa à esquerda de A. 
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11.2. Use o exercício anterior a fim de achar uma inversa à direita 
para a transformação linear A: Rê — Rº, dada por A(x,y,z) = (x + 
2y +3z,2x — y — z) e uma inversa à esquerda para a transformação 
linear B: R? > Rº, onde A(x,y) = (x + 2y,2x — y,x + 3y,4x +). 

; 111 : ; 
11.3. Dada a matriz a = | | , calcule aa! e, a partir daí, en- 


contre uma matriz b e M(3 x 2) tal que ab = L. 


11.4. Seja P: E — E uma projeção num espaço vetorial de dimensão 
finita, munido de produto interno. Prove que P* também é uma 
projeção. Dê um exemplo em que P* <P. 


11.5. Seja YU = (u;,,...,u,) uma base ortonormal do subespaço F, 
contido no espaço vetorial E, dotado de produto interno. Usando 4, 
defina a aplicação P: E > E, pondo, para todo v E E, Pv = pr,(v) = 
Tr 

>» (vu)uw. Prove que P é um operador linear com Zm(P) = F, 
i=1 

N(P) = Fl e P? = P. Obtenha assim outra demonstração de que 
E=Fg&F. (Vide Teorema 7.2.) 


11.6. Considere, no espaço vetorial M(n x n), o produto interno 
definido por 


(a, b) = >. Gij Di, 
ij 


sea — [a;]e lb = [bj]. (Vide Exercício 11.17.) Mostre que o 
subespaço À das matrizes anti-simétricas é o complemento ortogo- 
nal do subespaço S das matrizes simétricas em M(n x n). 


11.7. No espaço vetorial E das funções contínuas f: [1,1] > R, se- 
jam F,G c E os subespaços vetoriais formados pelas funções pares e 
pelas funções ímpares, respectivamente. Relativamente ao produto 
interno (f,g) = Ja f(x)g(x) dx, em E, mostre que G é o complemento 
ortogonal de F. 


11.8. Se os operadores lineares A,B: E > E comutam (isto é, AB = 
BA), prove que A* e B* também comutam. 


11.9. Sejam (uy,...,un) CE elvi,...,vm) C F conjuntos de geradores 
nesses espaços vetoriais com produto interno. Sejam ainda A: E > F 
e B: F-» E transformações lineares tais que (Au;,v;) — (1, Bv;) para 
i=1,...o,mej=1,...,n. Prove que B = A*. 
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11.10. Dada a matriz a e M(m x n), prove que ou o sistema ax = b 
tem solução qualquer que seja b e M(mx1) ou o sistema homogêneo 
transposto a!y — O admite uma solução não-trivial. 


11.11. No espaço M(n x n), munido do produto interno (a,b) = 
tr(a'b), (veja Exercício 11.17) considere uma matriz fixa a e defina 
o operador linear Ta: M(n x n) > M(n xn) pondo Tax = ax. Mostre 
que a adjunta de Ta é Tp, onde b = a!. Prove um resultado análogo 
para o operador Sa: M(n xn) > M(n x nn), onde S;x = xa. (Obs. 
tr(ab) — tr(ba).) 


11.12. Seja S: Rº — Rº a reflexão em torno do plano z = 0, parale- 
lamente à reta x = y = z. Determine a adjunta S*. Mesma questão 
para a projeção P: Rº — Rº, sobre o mesmo plano, paralelamente à 
mesma reta. 


11.13. Sejam A,B: E — E operadores lineares num espaço vetorial 
de dimensão finita, munido de produto interno. Prove que se B*A = 
O então, para todo v € E, os vetores Av e Bv são perpendiculares. Em 
particular, se A*A = O então À = 0. 


11.14. Para todo conjunto não-vazio X num espaço vetorial munido 
de produto interno, prove que X!+ = S(X) (subespaço vetorial gerado 
por X). 


11.15. Sejam F;, F, subespaços do espaço E, munido de produto in- 
terno. Prove que (6 +F)l =FinFS, (Anf)l=Fi+F. 


11.16. Dê mais uma demonstração de que À e A* têm o mesmo posto, 
nas seguintes linhas: a afirmação é verdadeira quando A: E > Fé 
injetiva ou sobrejetiva pois nestes casos A* é sobrejetiva ou injetiva, 
respectivamente. Para a conclusão no caso geral, use o fato de que 
toda transformação linear se escreve como um produto BA, onde B é 
injetiva e À é sobretiva. (Exercício 6.29.) 


11.17. Sejam E, F espaços vetoriais de dimensão finita, munidos de 
produto interno. Dadas as transformações lineares A, B: E — F, po- 
nha (A, B) = tr(A*B) e prove que isto define um produto interno em 
£L(E;F). (Vide Exercício 8.37.) Se a = [aj] e b = [b;;] são as matrizes 
de A e B em relação a bases ortonormais de E e F respectivamente, 
prove que (A,B) = 5 aibi;. 

j 
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11.18. Prove que uma projeção P: E > E, num espaço com produto 
interno, é ortogonal (isto é, N(P) = Zm(P)+) se, e somente se, para 
todo v E E tem-se (Pv,v — Pv) = 0. 


11.19. Use o exercício anterior para provar que se uma projeção 
P:E > E cumpre |Pv| < |v| para todo v E E então P é ortogonal. 
[Sugestão: suponha que, para algum v € E, Pv não fosse ortogonal 
a v— Pv. Tome w = pé da perpendicular baixada de O sobre a reta 
que contém v e Pv. Então |w| < |Pv|. Mas todos os pontos desta reta 
têm a mesma imagem por P. Logo |Pv| = |Pw| e daí |w| < |Pwl, uma 
contradição.] 


11.20. Ache uma base para o complemento ortogonal do subespaço 
(plano) de Rº gerado pelos vetores u = (3,)-1,2)ev=(—1,2,3). 


11.21. Dado o operador A:Rº — Rº, definido por A(x,y,z) =— 
(x+y+z,3x— 2y—z, —2x +3y +2z), obtenha bases para os seguintes 
subespaços de Rº: Tm(A), N(A), Im(A*) e N(A*). 


11.22. Considere a base fu,v,w) C Ré onde u = (1,1,1), v = (1,2,3), 
w = (1,-2,1). Determine as matrizes (na base canônica) dos funcio- 
nais lineares u*,v*,w*: Rê > R que formam a base dual de fu, v,w). 





11.23. Com a notação do exercício anterior, a base fu,v,w) C Rº 
determina um isomorfismo 1p: (R*)* — Rº, que a cada funcional f E 
(Rº*)* faz corresponder sua matriz (do tipo 1 x 3) na base dada. Prove 
que b(f) = [a,b,cl & f = aut + bv*t + cw. 


11.24. Demonstre que (AB)* = B*A* e A** = A, 


11.25. Estabeleça uma conexão entre os Exercícios 4.20 e 10.15 por 
intermédio do Teorema 11.1. 


11.26. Seja A: E > F uma transformação linear entre espaços de 
dimensão finita, com produto interno. Se dim E < dim F, prove que 
o operador AA*: F — F não é invertível mas se N(A) = (0) então 
A*A: E > E é invertível. Dê um exemplo desta situação com E = R? 
eF=. Que se pode afirmar quando dim E > dim F? 


11.27. Num espaço vetorial E munido de produto interno, sejam 
V=lvoesym)eW = [wy...,;wn) bases tais que (vw) = dj. 
(Cfr. Exercício 10.15.) Prove que a matriz do operador linear A* 
na base W é a transposta da matriz do operador À na base ). 
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11.28. Seja a uma matriz quadrada. Se o traço (soma dos elementos 
da diagonal) de a!.a é zero, prove que a = 0. 


11.29. Uma matriz quadrada a chama-se diagonalizável quando é 
semelhante a uma matriz d = [di;;] do tipo diagonal (dj — O sei £ j), 
ou seja, quando existe p invertível tal que p 'ap = d. Prove que 
se a é diagonalizável então a! também o é. Se a matriz do operador 
A: E > E relativamente a uma base de E é diagonalizável, prove que 
a matriz de A em relação a qualquer outra base é diagonalizável. 


11.30. Prove que a adjunta de A: E > E, onde Av = (v,a)b, é Atv = 
(v,b) a. 


11.31. Seja f*:R > E a adjunta do funcional linear f:E 5 R. 
Prove que v = f*(1) é o vetor de E que corresponde a f pelo isomor- 
fismo do Teorema 11.1. Prove ainda que f(f*(1)) = IvP e f*(f(w)) = 
(w,v)v Ywe E. 


11.32. Para toda transformação linear A: E > F, entre espaços de 
dimensão finita munidos de produto interno, prove que a restrição 
de À à imagem de A* define um isomorfismo A: Tm(A*) > Tm(A). 
Analogamente, A* transforma o subespaço Zm(A) isomorficamente 
sobre Tm(A*). São estes isomorfismos um o inverso do outro? 


11.33. Seja (u,..., um) C E uma base ortonormal. Para todo opera- 
dor linear A: E > E, prove que 


Tn n 
>. |Aui? = E |A*u;. 
Ei e] 


11.34. Seja J: F > E a inclusão do subespaço F C E, isto é, Jvy = v 
para todo v E F. Prove que J*J: F > F é o operador identidade de 
F e que o operador JJ*: E — E é a projeção de núcleo Fl e imagem 
F. (Noutras palavras, a adjunta J*: E — F é esta mesma projeção, 
porém considerada com contra-domínio F.) 


12 


Subespaços Invariantes 


Quanto menor é a dimensão do espaço E, mais fácil é estudar os ope- 
radores lineares A: E > E. (Isto é especialmente verdadeiro quando 
dim E = 1ou dim É = 2.) Por isso, quando se tem um operador 
A: E > E, é natural que se tente, de alguma maneira, “decompô-lo” 
em operadores definidos em subespaços de dimensões menores. O 
passo inicial nessa busca é a noção de subespaço invariante por um 
operador, que estudaremos nesta seção. E o caso de maior êxito é o 
dos operadores auto-adjuntos; como veremos na seção seguinte, todo 
operador daquele tipo se decompõe em operadores uni-dimensionais. 
Outros exemplos de sucesso serão vistos nas Seções 14e 15. As bases 
serão lançadas agora. 


Provaremos nesta seção (Teorema 12.1) que, dado um operador 
linear A: E > E num espaço vetorial de dimensão finita, ou bem 
existe um vetor não-nulo u E E tal que Au = Au ou então existem 
u,v € E linearmente independentes tais que Au e Av são ambos 
combinações lineares deu ev: Au = au + Bv, Av = yu + dv. Este 
fato será fundamental para o estudo de certos tipos particularmente 
importantes de operadores, como os auto-adjuntos e os ortogonais, 
que abordaremos nas seções seguintes. 

Para demonstrar o Teorema 12.1, faremos uso do chamado Teo- 
rema Fundamental da Álgebra, do qual resulta que todo polinômio 
mônico real se decompõe como produto de polinômios mônicos irre- 
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dutíveis do primeiro e do segundo graus. (Lembramos que se chama 
mônico um polinômio no qual o coeficiente do termo de mais alto 
grau é igual a 1 e que um polinômio irredutível do segundo grau não 
admite raiz real.) 

O teorema a ser demonstrado significa que existe em E um sub- 
espaço vetorial de dimensão 1 ou 2, invariante por A de acordo com 
a seguinte definição. 

Diz-se que um subespaço vetorial F C E é invariante pelo opera- 
dor linear A: E > E quando A(F) c F, isto é, quando a imagem Av 
de qualquer vetor v € F é ainda um vetor em F. 

Se F é um subespaço invariante do operador A: E > E, a restrição 
de À aos vetores de F define um operador que, salvo quando houver 
perigo de confusão, indicaremos com a mesma notação A: F > F. 
Assim, a existência de um subespaço invariante permite o estudo de 
um operador mais simples, por estar definido num domínio menor. 


Exemplo 12.1. Os subespaços (0) e E são invariantes por qualquer 
operador A: E > E. O núcleo N(A) e a imagem Tm(A) são também 
exemplos óbvios de subespaços invariantes. Um subespaço F de di- 
mensão 1 (reta passando pela origem) é invariante por À se, e so- 
mente se, existe um número À tal que Av = Av para todo v E F. [Com 
efeito, fixando um vetor u 4 O em F, todos os demais elementos de 
F são da forma ou, « Ee R. Como Au € F, tem-se Au = Au. Para 
qualquer outro v € F, vale v = au logo Av = «Au = «Au = Aou, logo 
Av = Av, com o mesmo À.|] Seu,v E E são linearmente independen- 
tes, o subespaço F gerado por u e v (plano contendo a origem) é inva- 
riante por À se, e somente se Au € Fe Av E F, isto é, Au = au + Bv 
eAv=yu+óov. 








Um vetor v 2 O em E chama-se um autovetor do operador 
A: E > E quando existe A E R tal que 


Av= AM. 


O número À E R, por sua vez, chama-se um autovalor do operador 
A quando existe um vetor não-nulo v € E tal que Av = Av. Diz-se 
então que o autovalor À corresponde, ou pertence, ao autovetor v e, 
vice-versa, que o autovetor v também corresponde, ou pertence, ao 
autovalor À. Então, para todo w = av, tem-se Aw = Au. 
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Achar um autovetor (ou, o que é equivalente, um autovalor) do 
operador A é, portanto, o mesmo que achar um subespaço de di- 
mensão 1 invariante por A. 

Analogamente, diz-se que o número real À é um autovalor da 
matriz a € M(n x n) quando À é um autovalor do operador A: R”" — 
R", cuja matriz na base canônica é a. Isto significa que existe um 
vetor x O em R” tal que Ax = Ax ou, o que é, o mesmo, uma matriz 
não-nula x e M(n x 1) tal que ax = Ax. 


Exemplo 12.2. Uma rotação R: R? — Rº em torno da origem, de 
ângulo diferente de 0º e 180º, não admite outros subespaços invari- 
antes além de (0) e R?. Por outro lado, para todo « € R, a rotação 
A: Rº — Rº de ângulo « em torno do eixo z, definida por 


Alx,y,Z) = (xcosa — ysena,x sena +ycosa,z), 


tem o eixo z e o plano z = O como subespaços invariantes. Para todo 
z 0,0 vetor v = (0,0,z) é um autovetor de A, cujo autovalor cor- 
respondente é 1, pois Av = v. Já no caso de uma reflexão S: E > Eem 
torno do subespaço F;, paralelamente a F; (vide Teorema 7.3), todo 
vetor não-nulo em F, é um autovetor de S, com autovalor 1, enquanto 
que os vetores não-nulos em F, são autovetores correspondentes ao 
autovalor —1. Finalmente, se o operador A tem núcleo não-trivial 
então todo vetor não-nulo v E N(A) é um autovetor pois Av = 0 -v. 


Exemplo 12.3. O operador A:R? — R?, definido por A(x,y) =— 
(x + «y,y), chama-se cisalhamento. Se « 0, os únicos subespaços 
invariantes por A são (0), R? e o eixo das abcissas. Com efeito, qual- 
quer outro subespaço de R? é uma reta F, formada pelos múltiplos 
tv = (ta, tb) de um vetor v = (a,b), com b £0. Set £ O tem-se tv E F 
mas A(tv) = (ta + «tb, tb) = tv + (atb, 0) é Flogo F não é invariante 
por A. 

Dados o polinômio p(x) = ao +ax+--: + ax” e o operador 
A: E > E, a notação p(A) indica o operador 





p(A)=al+aAÃ+---+ anA”. 


Lema. Para todo operador linear A: E > E, num espaço vetorial de 
dimensão finita, existem um polinômio mônico irredutível p, de grau 
lou 2, eum vetor não-nulo v e E, tais que p(A) -v = 0. 
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Demonstração: Seja n = dim E. Como dim£L(E) = nº, os 


n? + 1 operadores 1,A,... AR? são linearmente dependentes. Por- 
tanto existem números reais &0,..., &,2, não todos nulos, tais que 
Gol+HoÃ+--«+a, A? -O. Seja am 0 coeficiente não-nulo de maior 
índice nesta expressão. Dividindo-a por am, obtemos um polinômio 
mônico p(x) = Bo + Bix + --- + Bmix"o! + x” tal que p(A) — 0. 
Sabemos que existe uma fatoração p(x) = pi(x) - pz(x)--- pu(x), onde 
cada p; é um polinômio mônico irredutível de grau 1 ou 2. Temos 
pi(A) - pa(A)---pr(A) = 0. Logo, pelo menos um dos operadores 
pi(A) não é invertível. Assim, existe um vetor não-nulo v € E tal que 
pilA)-v=0. 














Teorema 12.1. Todo operador linear num espaço vetorial de di- 
mensão finita possui um subespaço invariante de dimensão 1 ou 2. 


Demonstração: Dado A: E > E, sejam p o polinômio ev € E o vetor 
não-nulo dados pelo lema, com p(A).v = 0. Se p(x) =x — À então 
Av — Av = 0, donde Av = Av, logo a reta que passa pela origem e 
contém v é um subespaço invariante por A, de dimensão 1. Se p tem 
grau2,p(x)=x?+ax+b, então A?v4+ aAv+bv=p(A)-v=0, logo 
A(Av) = —aAv — bv. Isto mostra que o subespaço gerado por v e Av 
é invariante por A. Além disso, v e Av são L.I. pois se tivéssemos 
Av = Av então 


0=Alv+aAv+bv=Av+ ak +bv= (N2 + aA+b)y, 
donde Xº + aA + b = 0, uma contradição pois p(x) = x? + ax + b não 


tem raiz real. Logo o subespaço invariante gerado por v e Av tem 
dimensão 2. 














Um operador linear num espaço vetorial de dimensão n admite 
no máximo n autovalores distintos. Isto é consequência do 


Teorema 12.2. A autovalores diferentes do mesmo operador corres- 
pondem autovetores linearmente independentes. 


Demonstração: Dado o operador linear A: E > E, sejam vy,...,vVm 
vetores não-nulos em E tais que Av; = AyV3,..., Avm = AmVm, onde 
os números reais Ay,..., Am são dois a dois diferentes. Provaremos, 
por indução, que esses vetores são L.l.. A afirmação é óbvia quando 
m = 1. Supondo-a verdadeira para m — 1 vetores, inferiremos daí 
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sua validez para m. Dada a combinação linear nula 
vi +: + amym =0, ÇS) 


aplicamos o operador A a ambos os membros desta igualdade, le- 
vando em conta que Av; = Avi. Resulta então que 


Ai VI + ee + Am&mVm = 0. (+) 


Multiplicando a igualdade (*) por Am e subtraindo de (**) vem: 





(Ar — Amboyva +: + (Am — Am) Em Vim = 0. 
Pela hipótese de indução, os vetores v1,...,Vm-1 são L.I.. Logo 
(A1 — Amjoa = -** = (An-1— Am) = 0. 


Como os autovalores são todos diferentes, as m — 1 diferenças nos 
parênteses acima são £ 0, logo «y = --- = &m-1 = O. Isto reduz 
a igualdade (*) a amvm = O. Como vm 0, segue-se que um = 0. 
Assim, a igualdade (*) só pode ocorrer quando todos os coeficientes 
a«; são nulos, o que prova o teorema. 














Corolário. Seja dim E = n. Se um operador linear A: E > E possui 
n autovalores diferentes então existe uma base (vy,...,vn) C E em 
relação à qual a matriz de A é diagonal (isto é, tem a forma lai] com 
a; =OseiZj). 


Com efeito, se Av; = AyjV1,..., Ava = AnVn com os v; não-nulos e 
os A; dois a dois distintos então [vy,..., vn) é, em virtude do Teorema 
12.2, uma base de E. A matriz de À nesta base é 


Pa 
A 


na qual os termos que não aparecem são iguais a zero. 














A igualdade Av = Av equivale a (A — Al)v = 0, logo v é um 
autovetor do operador A: E — E se, e somente se, é um elemento 
não-nulo do núcleo N'(A — AI). Noutras palavras, a fim de que À 
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seja um autovalor de A é necessário e suficiente que o operador 
A-A: E > E não possua inverso. 


Exemplo 12.4. Um caso particular importante ocorre quando 
dim E = 2. Vimos no Exemplo 2.6 que se (u,vl c E é uma base 
então os vetores au + Bv e yu + dv são linearmente dependentes se, 
e somente se, «ô — By = O. Dados o operador A:E > E e a base 
(u,v) Cc E, sejam Au = au +cve Av = bu + dv. Noutras palavras, a 
matriz do operador À na base (u, v] é 


ab 

c d|: 
Então (A-ADu=(a-Nu-+cve (A-ADv=bu+(d—A)v. À fim de 
que A—AI não seja invertível é necessário e suficiente que os vetores 


(A-Alue (A-—AI)v sejam L.D., ou seja, que (a— A)(d—A)— be =0, 
ou ainda, que À seja raiz do polinômio 


p(A)=A2— (a + d)A+ ad — be, 


chamado o polinômio característico do operador A. 

Portanto, o número real À é um autovalor do operador A: E 5 E, 
onde dim E = 2, se, e somente se, é uma raiz do polinômio carac- 
terístico do operador A, o qual, por definição, é p(A) = A — (a + d)A+ 
ad—bc. Os coeficientes de p(A) são tirados da matriz de A em relação 
a uma base qualquer de E. 


Observação. A matriz do operador A muda quando se passa de 
uma base para outra. Mas o polinômio p(A) (isto é, as expressões 
a+ de ad— bc, que são seus coeficientes) permanece (isto é, perma- 
necem) sem alteração. Isto será provado na Seção 20. No presente 
caso (dim E = 2), é claro que a + d = traço de A, logo independe da 
base escolhida. Quanto ao coeficiente ad — bc (o determinante da 


matriz a = É à ), vide o Exercício 12.7. 


Exemplo 12.5. No caso da rotação R: R? — R?, R(x,y) = (x cos 0 — 
ysen 0,xsen O +vycos 0), temos a = cos 0, b = —sen 0, c = sen 0, 
d = cos 0, logo o polinômio característico de R é 


p(N)=A2— (2 cos 0)A+1. 
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Se 0 £0€e0 Z180º,o trinômio p(A) não possui raiz real pois neste 
caso seu discriminante A = 4(cos? 0 — 1) é negativo. Conseqiente- 
mente R só possui autovalores (reais) se 0 = 0 ou O = 180º. 


Exemplo 12.6. Definamos o operador A: R? — R? pondo A(x,y) = 
(4x + 3y,x + 2y). Seu polinômio característico é p(A) = Nº — 6145, 
cujas raízes são Ay = Te A, = 5. Estes números são autovalores de A. 
Existem, portanto, vetores não-nulos v; e vz em R?, tais que Avi = VI 
e Avz = 5v2. Pelo Teorema 12.2, v; e vz formam uma base de Rº, em 
relação à qual a matriz do operador A tem a forma diagonal: 


es 10 
“0 5 
A fim de determinar os vetores v; = (x,y) e vz = (r,s) exprimimos as 


igualdades Av; = vj e Avz = 5vz em termos de coordenadas, obtendo 
os sistemas lineares 


4x +3y =x 

tHiysy 
e 

4r+3s=5r 

r+2s=5s. 


Ambos os sistemas acima são indeterminados, e tinham que ser 
assim pois se v é autovetor de A, todo múltiplo «v também é. To- 
mando uma solução não-nula de cada um desses sistemas obtemos 
vi = (1,—1),v = (3,1) tais que fv,,v2) C R? é uma base formada por 
autovetores de A. 


Exercícios 


12.1. Suponha que o operador linear A: E — E, num espaço vetorial 
de dimensão n, admita um subespaço invariante F, de dimensão r. 
Prove que existe uma base de E, relativamente à qual a matriz de A 


tem a forma 
a b 
0 c|' 
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coma e M(trxr),be M(rx(n-—-+r)),0€e M((n—-r)xr)ece 
M((n—r)x (n—r)). 


12.2. Enuncie e prove um resultado análogo ao do exercício anterior, 
supondo que E = F& G, onde Fe G são invariantes pelo operador A. 


12.3. Dê exemplo de um operador linear A: Rê — Rº que admite um 
subespaço invariante F € Rº com a seguinte propriedade: nenhum 
subespaço G CR” tal queRº*-F& G é invariante por A. 


12.4. Dado o vetor não-nulo a € Rº, determine os subespaços de 
Rº invariantes pelo operador A: Rº — IR, definido por Av = a x v 
(produto vetorial: veja Exercício 10.27). 


12.5. Sejam A,B: E — E operadores lineares. Se AB = BA, prove 
que N(B) e Zm(B) são subespaços invariantes por A. 


12.6. Dado o operador linear A: E — E e o polinômio p(x), prove 
que os subespaços vetoriais N(p(A)) e Zm(p(A)) são invariantes 
por A. 


12.7. Um operador A: E — E chama-se normal quando AA* = A*A. 
Prove que se À é normal então, para todo v € E, tem-se |Av| = |A*vl 
e conclua daí que todo auto-vetor de À é também auto-vetor de A*, 
com o mesmo auto-valor. (Sugestão: se À é normal, A—AI também é.) 


12.8. Se o operador A é normal, prove que N(A)! = Tm(A). 


12.9. Seja P: Rê — Rº uma projeção de posto 2. Prove que os únicos 
subespaços de Rº invariantes por P estão contidos na imagem ou 
contêm o núcleo de P. E se o posto de P for iguala 1? 


12.10. Mostre que os subespaços vetoriais de C"(R,R) gerados por 
cada um dos conjuntos abaixo são invariantes pelo operador de de- 
rivação D: CS(R,R) > CARR). 

(a) (cos x, sen xJ; 

(b) [e*,xe*,x2e*). 
12.11. Se F c Rº é um subespaço de dimensão 2, invariante pelo 
operador linear A:Rº — Rº, e A não possui auto-vetores em F, 
prove que nenhum subespaço de dimensão 2, além de F, é invariante 
por A. 


12.12. Dado o operador linear A: E — E num espaço vetorial de 
dimensão 3, prove que existe uma base de E relativamente à qual a 
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matriz de A tem uma das formas abaixo: 


ab oO a be 
c do ou c df 
e fg 0 0 g 


Em qualquer caso, prove que existe um vetor não-nulo v E E tal que 
Av = gv. [Observação: veremos na Seção 20 que, mais geralmente, 
todo operador linear num espaço vetorial de dimensão ímpar possui 
pelo menos um auto-vetor.] 


12.13. Se F,, F; € E são subespaços invariantes pelo operador linear 
A: E > E, prove que NF, e F; + F também são invariantes por A. 


12.14. Seja A: E — E um operador invertível, com dim E finita. Se 
o subespaço F C E é invariante por A, prove que a restrição de À a 
F é ainda um operador invertível F > Fe conclua que F é também 
invariante por A!. 


12.15. Quais são os autovetores e autovalores do operador de deri- 
vação D:P 5 P? 


12.16. Num espaço vetorial E de dimensão n, prove que todo ope- 
rador linear possui um subespaço invariante de dimensão n — 1 ou 
n—2. (Sugestão: aplique o Teorema 12.1 à adjunta do operador dado, 
tendo antes introduzido um produto interno em E.) 


12.17. Se v e w são respectivamente autovetores de À e A*, corres- 
pondentes a autovalores À Z u, prove que (v,w) = 0. 


12.18. Prove que um operador À é invertível se, e somente se, não 
tem autovalor igual a O. No caso afirmativo, prove que os autoveto- 
res de A e de A! coincidem. E os autovalores? 


12.19. O determinante da matriz a — E à é, por definição, o 
número det a = ad — bc. Mediante um cálculo direto, mostre que se 
m= [ i então det(am) = det a - det m. Prove ainda que det a < 


O se, e somente se, a é invertível. Conclua que, para toda matriz 
invertível m, tem-se det a = det(m !'am), logo todas as matrizes do 
operador A: E > E, com dim E = 2, têm o mesmo determinante, o 
qual é chamado o determinante do operador A. 
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12.20. Dado o operador linear A: E > E, suponha que E = KH O É, 
onde Av; = Ayv; sev; E Fe Avz = Av; se vz E É, com Ày £ Az. Prove 
que A, e A; são os únicos autovalores de À e que os autovetores de A 
estão em F, ou em Fs. 


12.21. Seja A:R” — R” o operador linear cuja matriz na base 
canônica tem todos os elementos iguais a 1. Prove que o posto de 
AéigualalequeR" = N(A) & Tm(A). Conclua que os autovalores 
de À são 0 en e que seus autovetores pertencem a N(A) oua Zm(A). 
Exiba uma base de R” na qual a matriz de A tem n? — 1 zeros. 


12.22. Se todo vetor não-nulo de E for um autovetor do operador 
linear A: E > E, prove que À = AI. 


12.23. Para todo autovalor À do operador linear A:E > E, seja 
E, = (v € E;Av = Av). Prove que E, é um subespaço vetorial de E, 
invariante por A. (E, chama-se auto-subespaço correspondente ao 
autovalor À.) 


12.24. Prove que um subespaço que contém o núcleo de uma proje- 
ção é invariante por essa projeção. 


12.25. Se AB = BA, prove que a imagem por B de um subespaço 
invariante por À é ainda invariante por A. 


12.26. Seja A: E — E um operador linear tal que A? possui algum 
autovalor > 0. Prove que À possui autovetor. Dê um exemplo em 
que A? possui autovetor mas A não possui. 


12.27. Se os autovetores do operador linear A: E — E geram o espaço 
E e, além disso, os subespaços invariantes por À são também invari- 
antes por B, prove que AB — BA. 


12.28. Seja dim E = n. Se o operador linear A: E > E possui n 
autovalores distintos, prove que existem no espaço E exatamente 2” 
subespaços invariantes por A. 


12.29. Seja A: E — E um operador no espaço vetorial E, de dimensão 
finita, onde E=F &--- PF, e cada F; é invariante por A. Tome uma 
base V c E que seja uma união de bases dos F;. Determine a forma 
da matriz de À na base ). 
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12.30. Seja A:R? — Rº o operador definido por A(x,y) = (1,0). 
Quais são os autovalores de A? E os autovetores? Se a = o o ; 
existe alguma matriz invertível p e M(2x2) tal que p !ap seja uma 
matriz diagonal? 


12.31. Seja A:R? — Rº o operador definido por A(x,y) = (2x — 
y,x + 4y). Mostre que A possui um autovalor único igual a 3 e que o 
auto-subespaço E; (v. Exercício 12.23) tem dimensão 1. Conclua que 


se 
de 2 — 
“Ito 4 
então não existe uma matriz invertível b e M(2 x 2) tal que b”!ab 
seja diagonal. 


12.32. Seja A:R? — R? o operador definido por A(x,y) = (3x + 
y,2x+2y). Mostre que À possui os autovalores 4 e 1. Ache uma base 
fu,v;CcR? tal que Au =4ue Av=v. Dada a matriz 


“Ba 
Ah jo SRA 


ache uma matriz invertível pe M(2 x 2) tal que p !ap = R | ' 
12.33. Prove que todo operador linear de posto 1 em R” possui um 
autovetor cujo autovalor correspondente é o traço do operador dado. 


12.34. Seja p um polinômio £ O cujas raízes são todas reais. Se 
p(A) = 0, prove que pelo menos uma raiz de p é autovalor do opera- 
dor A. 


12.35. Se o espaço vetorial E possui uma base formada por autove- 
tores do operador A: E > E, prove que existe também uma base de 
E formada por autovetores de A*: E > E. (Veja Exercício 11.29.) 


12.36. Sejam A: E > E um operador linear num espaço de dimensão 
finita, munido de produto interno e F c E um subespaço invariante 
por A. Defina o operador B: F —» F pondo Bv = Av. Mostre que, para 
todo v E F, se tem A*v = B*v + Cv, com Cv € F+. 


13 


Operadores Auto-Adjuntos 


O Teorema Espectral para operadores auto-adjuntos, a ser provado 
nesta seção, é um dos resultados mais relevantes da Álgebra Linear. 
Serão também demonstradas algumas de suas consegiiências, entre 
as quais se destaca o Teorema dos Valores Singulares. 


Um operador linear A: E > E, num espaço vetorial munido de 
produto interno, chama-se auto-adjunto quando A = A*, ou seja, 
quando (Au,v) = (u, Av) para quaisquer u,v € E. 

Se A,B:E — E são operadores auto-adjuntos e « E R então 
(A+B)* = A*+B* = A-+Be(«A)* = «A* = «À, logo A+ Be 
«A são auto-adjuntos. 

O produto AB dos operadores auto-adjuntos A, B é auto-adjunto 
se, e somente se, À e B comutam, isto é, AB — BA. Com efeito, sendo 
Ae B auto-adjuntos, temos 


(AB)* = B*A* = BA, 
Logo, AB é auto-adjunto se, e somente se, BA = AB. 


Exemplo 13.1. Sejam A,B:R? — R? os operadores lineares defi- 
nidos por A(x,y) = (x,2y) e B(x,y) = (y,x). Para todo v = (x,y) 
tem-se: 

(en vi=iAcuv= tev)=*% 

(e2, Av) = (Ae, v)= Qo,vi= 2y, 
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portanto A*v = (x,2y) = Ave A* = A. Analogamente se mostra 
que B* = B. Entretanto, como AB(x,y) = (y,2x), vê-se que, para 
v= (x,y), (ey, (AB)*v) = (ABes,v) = 2y, enquanto (ey, ABv) = y, logo 
(AB)* AB, ou seja, o produto AB dos operadores auto-adjuntos 
A, B não é auto-adjunto. Isto se dá porque AB BA. Com efeito, 
AB(x,y) = (y,2x) e BA(x,y) == (Qu,x). 


Exemplo 13.2. A projeção ortogonal P: E — E sobre um subespaço 
Fc E é um operador auto-adjunto. Com efeito, dados v = z + w, 
vV=7+w,comz,z' €EFew,w' € Fl, temos 


Pv etav)elaci= ve edu): 


Reciprocamente, se a projeção P: E — E sobre o subespaço F;, para- 
lelamente a F>, onde E = F, 4, for um operador auto-adjunto então 
para quaisquer v; € H, vz € É vale 


(vi, V2) = (Pv, vz) = (vi, Pvz) = (v1,0) = 0, 


logo F; = LE Assim, a projeção P: E — E é um operador auto-adjunto 
se, e somente se, é uma projeção ortogonal. 

Uma matriz quadrada a = [ai;;] diz-se simétrica quando é igual à 
sua transposta a!, isto é, quando a; = aj para todo i e todo j. 

No teorema 13.1 é dado um operador linear A: E > E, num 
espaço vetorial de dimensão finita, dotado de produto interno. 


Teorema 13.1. A: E > E é auto-adjunto se, e somente se, sua matriz 
a — [ai] relativamente a uma (e portanto a qualquer) base ortonor- 
mal U = (uy,...,Un) C E é uma matriz simétrica. 


Demonstração: (u;, Au;) = [i-ésima coordenada do vetor Au; na 
base 4] = [i-ésimo elemento da j-ésima coluna de a] = a;. Portanto 
a matriz a é simétrica se, e somente se, (ui, Au;) — (Au;,u;) para 
quaisquer i,) = 1,...,n. Devido à linearidade de A e à bilinearidade 
do produto interno, isto equivale a dizer que (u, Av) = (Au,v) para 
quaisquer u,v € E, ou seja, que À é auto-adjunto. 














Exemplo 13.3. As matrizes dos operadores À e B do Exemplo 13.1 
na base canônica de R? são respectivamente 


10 01 
eba) e dba) 
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ambas simétricas. Quanto ao Exemplo 13.2, se tomarmos em E uma 
base ortonormal cujos primeiros m elementos formem uma base de 
F e os últimos uma base de F+, a matriz da projeção P nesta base 
terá os m primeiros termos da diagonal iguais a 1 e todos os demais 
elementos iguais a zero. Seu formato será 


1 


0 


onde os termos fora da diagonal, não indicados acima, são todos ze- 
ros. Essas matrizes são simétricas, refletindo o fato de que represen- 
tam operadores auto-adjuntos em bases ortonormais. Já o operador 
A no Exemplo 12.6 não é auto-adjunto pois na base canônica de R? 


sua matriz é “a 

1 2] 
Teorema 13.2 Seja A: E — E um operador auto-adjunto. Seo su- 
bespaço F C E é invariante por A, seu complemento ortogonal Fl 
também é. 


O Teorema 13.2 decorre imediatamente do 


Teorema 13.3 Se o subespaço F C E é invariante pelo operador li- 
near A: E — E então seu complemento ortogonal Fl é invariante pelo 
operador adjunto A*: E 5 E. 


Demonstração: lu chvceF]> AucF> (u,A*v) = (Au,v) = 
0 = Atv E Fl, logo F- é invariante por A*. 














Exemplo 13.4. No cisalhamento A:R? — R?, onde A(x,y) 
(x + «y,y), com « £ 0, o eixo x, das abcissas, é invariante mas 
seu complemento ortogonal, o eixo y, das ordenadas, não é pois 
Aez = (x,1) não é vertical. 

No caso de um operador auto-adjunto, o Teorema 12.2 assume a 
forma mais precisa seguinte. 
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Teorema 13.4. Se A,,...,Am são autovalores dois a dois diferentes 
do operador auto-adjunto A: E — E, os autovetores correspondentes 
Vi»... , Vm São dois a dois ortogonais. 


Demonstração: Para i <j quaisquer: 


(A j) (vi vi) = (Aviv) — (vi Av;) = (Aviv) — (vi Avi) 
= (Avi, V;) — (Avi, vj) = O pois À é auto-adjunto. 














Como À; — À; + 0, de (A — A;) (Vi Vi) = 0 resulta (Vi, Vi) =0. 


Observação. Se Av = Av então, para todo múltiplo w = av, tem- 
se ainda Aw = Aw. Logo, na situação do Teorema 13.4, os vetores 
v1,--., Vm podem ser tomados unitários, caso haja conveniência. 

Um problema importante sobre operadores num espaço vetorial 
de dimensão finita é o de encontrar uma base em relação à qual 
a matriz desse operador seja a mais simples possível. Mostrare- 
mos nesta seção que, se A: E > E é um operador auto-adjunto num 
espaço vetorial de dimensão finita com produto interno, existe uma 
base ortonormal em E, relativamente à qual a matriz de À é uma 
matriz diagonal a — [ai], isto é a; — O sei £j. Este é o conteúdo do 
Teorema Espectral. 

Existe um tipo de operador auto-adjunto para o qual o Teorema 
Espectral é imediato: se P:E — E é a projeção ortogonal sobre o 
subespaço F, tomando uma base ortonormal (u1,...,Un); C E cujos 
primeiros vetores u,...,Uum formem uma base de F (portanto os 
n — m últimos formam uma base de F!), a matriz de P nesta base 
tem a forma diagonal vista no Exemplo 13.3. 

Quando se diz que a matriz do operador A: E > E na base 
(uy,...,Un) C E é uma matriz diagonal, isto significa que, para todo 
j=1,...,n, tem-se Au; — Aju, ou seja, que os vetores da base dada 
são todos eles autovetores de A. 

No caso da projeção ortogonal sobre o subespaço F, tem-se 
Piy= a para j = Iscgm é Pu; = 080) em + 1,...; Mu Asa, 
a base ortonormal acima fixada é de fato formada por autovetores 
de P. Os autovalores são 1 e 0. 

Começamos com o caso particular do Teorema Espectral em que 
espaço tem dimensão 2. 
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Teorema 13.5. Seja A:E > E um operador auto-adjunto num 
espaço vetorial de dimensão 2, munido de produto interno. Existe 
uma base ortonormal (wu, u2) E E formada por autovetores de A. 


Demonstração: Seja (v,w) c E uma base ortonormal arbitrária. 
Em virtude do Teorema 13.1, temos Av = av + bw, Aw = bv+ 
cw. Como vimos antes no Exemplo 12.4, os autovalores de À são 
as raízes reais do polinômio característico p(A) = N=(00)A dr 

b2. O discriminante deste trinômio é A = (a+c)? —4(ac— b?) = 
(a-c)2+4b >0. SeA=0Oentãob=0,a=ceA = al, logo todo 
vetor não-nulo em E é um autovetor. Se À > 0 então o trinômio p(A) 
possui 2 raízes reais distintas A, A2. Isto, como sabemos, quer dizer 
que os operadores A — Ajl e À — AyI são ambos não invertíveis, logo 
existem vetores não-nulos (que podemos supor unitários) uy,u2 E E 
tais que (A — AMDu,; = 0 e (A-—Mlu, = 0, ou seja, Au, = Aju e 
Au, = Au. Pelo Teorema 13.4, (uy, uz) € E é uma base ortonormal 
de autovetores de A. [1] 








Corolário. Todo operador auto-adjunto A: E > E, num espaço veto- 
rial de dimensão finita com produto interno, possui um autovetor. 


Com efeito, pelo Teorema 12.1 existe um subespaço F C E, de 
dimensão 1 ou 2, invariante por A. Se dim F = 1 todo vetor não-nulo 
v E F é um autovetor de A. Se dim F = 2 então, aplicando o Teorema 
13.5 à restrição A: F — F de À ao subespaço invariante F, obtemos 
um autovetor v € F. [] 





Teorema 13.6. (Teorema Espectral.) Para todo operador auto- 
adjunto A: E > E, num espaço vetorial de dimensão finita munido 
de produto interno, existe uma base ortonormal (uy,...,un) E E for- 
mada por autovetores de A. 


Demonstração: Usaremos indução na dimensão de E. O teorema é 
evidente se dim E = 1. Supondo-o verdadeiro em dimensão n — 1, 
seja dim E = n. Pelo Corolário do Teorema 13.5, existe um au- 
tovetor unitário un, portanto um subespaço F c E, de dimensão 
1, invariante por A. Pelo Teorema 13.2, o complemento ortogonal 
Fl também é invariante por A. Como dimFl = n-1, a hi- 
pótese de indução assegura a existência de uma base ortonormal 
(u1,...,Un-1) C FÊ formada por autovetores da restrição A: FL — 
Fl. Segue-se que (uy,...,Un 1, Un) C E é uma base ortonormal for- 
mada por autovetores de A. 














Seção 13 Operadores Auto-Adjuntos 161 


Observação. Vale a recíproca do Teorema Espectral: se existe uma 
base ortonormal (u,..., un: C E formada por autovetores do opera- 
dor A: E > E então este operador é auto-adjunto. Com efeito, para 
quaisquer i,j = 1,...,n, tem-se 








(Aui, Us) = (Aus, 1) A;ôi; A;di; (Ui, Aju) = (u;, Au) 


e daí resulta que (Au, v) = (u, Av) para quaisquer u,v € E. 

Diremos que o operador linear A: E > E é não-negativo, e escre- 
veremos À > 0, quando A for auto-adjunto e, além disso, (Av,v) > 0 
para todo v € E. No caso particular em que (Av,v) > O para todo 
v 0, diremos que À é um operador positivo e escreveremos À > 0. 


Teorema 13.7. Um operador auto-adjunto A: E > E é não-negativo 
se, e somente se, seus autovalores são todos > O. A é positivo se, e 
somente se, todos os seus autovalores são números positivos. 


Demonstração: Se À >0e Av=Avcomv 0 então 
A (VV) — (Av, v) E (Av,v) > 0, 


portanto À > 0. Reciprocamente, se os autovalores de À são > 0, 
seja (u1,...,Uny €C E uma base ortonormal formada por autovetores 
(a qual existe pelo Teorema Espectral), com Au; = A;u;. Para todo 
vetor v € E, tem-se v = qyuy + --- + anum, logo 


(Av, v) = (Lou A Logus) = (LxA, Logu;) = FAo?. 
Como À; > O parai = 1,...,n, segue-se que (Av,v) > 0, portanto 


A > 0. A afirmação sobre operadores positivos se prova da mesma 
maneira. 














Corolário 1. Seja À > 0. Se, para um certo v E E, vale (Av,v) = O 
então Av = 0. 


Com efeito, sejam Ay, ..., A os autovalores não-nulos de A. Então, 
pondo v = «ju +--- + «num, resulta que Av = Ayjoayuy +--- + A AkUk, 
donde 

RE o E RO A 


Como À, > 0,...,Ak > 0, segue-se que « = ---. = «, = 0, portanto 
Av =0. 
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Observação. Geometricamente, A > 0 significa que o ângulo entre 
v e Av (caso estes vetores sejam 0) é sempre agudo ou reto. O 
Corolário 1 diz que, quando Av £ 0, esse ângulo é sempre agudo. 


Corolário 2. Um operador é positivo se, e somente se, é não-negativo 
e invertível. 


Com efeito, se À > O é invertível então, para todo v < O tem-se 
Av £ 0 logo, pelo Corolário 1, (Av,v) > 0. A recíproca é óbvia. 














Uma matriz quadrada a = [a;] e M(n x nn) diz-se não-negativa, 
e escreve-se a > 0, quando o operador A: R” > R”, cuja matriz na 
base canônica é a, é não-negativo. 

Dado v = (x1,...,xn) € R”, tem-se Av = (y1,...,yn) onde, para 
cadai=1,...,n, Ui = MIX + qux + --- + qinXn. Logo 


(Av, v) =D xu= = sz AijXiX; - 


1j=1 


Portanto a matriz a = [la;] e M(n xn) é não-negativa se, e somente 
se, é simétrica e, para todo v = (xy,...,Xxn) € R” tem-se 


n 
a AjXiX; 2 0. 


ij=] 


Analogamente, a matriz a diz-se positiva quando o operador 
A:R?  R”, que a ela corresponde, é positivo. Isto significa que 
a é simétrica e, para todo v = (x1,...,Xxn) £ 0 em R?, tem-se 


n 
E UjXiX; > 0. 


Lj=1 


Assim uma matriz simétrica é não-negativa (respect. positiva) 
se, e somente se, seus autovalores são > O (respect. positivos). 


Exemplo 13.5. O polinômio característico da matriz simétrica 


a= Ê E ép(A)=M — (a+c)A + ac — b?. A soma de suas raízes é 





a+ceo produto é ac—b?. As raízes de p(A) são ambas positivas se, e 
somente seac—b? >0ea > 0O(ouc > 0). Com efeito, ac—b? > 0 (isto 
é, ac > b?) diz que essas raízes têm o mesmo sinal. De a > 0 tiramos 
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c>b?/a > 0, logo a +c > 0 e o sinal comum das raízes é positivo. 
Portanto as condiçõesa>0eac—-b? >0(ouc>0eac—b? >0) são 
necessárias e suficientes para que a matriz simétrica a seja positiva. 
Para que se tenha a > 0 é necessário e suficiente que ac — b? > 0, 


a>0ec>õo0. Assim, por exemplo, a matriz é positiva e 


1 = 
—1 2 
à e É á 
| | é não-negativa. 

Um operador X: E — E chama-se raiz quadrada do operador 
A: E E quando Xº? = A. 

Para uso na demonstração do Teorema 13.8, apresentaremos 
uma noção que tem outras aplicações. 

Se À é um autovalor do operador A: E > E, o conjunto 


Ey=[ve E; Av= Av 


é um subespaço vetorial de E, invariante por A, chamado um auto- 
subespaço. Restrito a E», o operador À é simplesmente a multiplica- 
ção por À. Assim, todo vetor não-nulo em E, é um autovetor de A, 
com autovalor À. 

Quando À é auto-adjunto e Ay,...,A, são seus autovalores distin- 
tos então, pelo Teorema 13.4, para i + j, todo vetor em E,, é orto- 
gonal a qualquer vetor em E,,. Além disso, pelo Teorema Espectral, 
todo vetor v € E se escreve, de modo único, como v = v + --- +v,, 
onde v; € Ey,,...,Vr E E,,, ou seja, E é soma direta dos subespaços 
RR = 


Teorema 13.8. Todo operador não-negativo A: E — E, num espaço 
vetorial de dimensão finita munido de produto interno, possui uma 
única raiz quadrada não-negativa, a qual é positiva se, e somente se, 
A é positivo. 


Demonstração: Sejam À > 0,...,A > 0 os autovalores distintos 
de A. Todo vetor v € E se escreve, de modo único, como v = vj +---+ 
vr, onde vi € Eh,,...,Vr E Ea, logo Av = Ayv; +--- + Arv,. Definimos 


o operador linear B: E > E pondo 
Bv=vA vid dy A cv 


Sew =wj+-::+w, com w € E»,,...,W E E», então (vi; w;) = O 
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para i <j, portanto 
(Bv, w) -+ vVA(vo wi) = (v,Bw) e (Bv,v) -+ Vivi? 


Logo B é um operador não-negativo. Além disso, é claro que B2v = Av 
para todo v € E, logo B é uma raiz quadrada de A. Para provar que 
é única a raiz quadrada não-negativa de A, começamos observando 
que toda raiz quadrada de A comuta com A. Com efeito, se C? = 
então AC = C?C — CC? = CA. A observação seguinte é que se C 
comuta com À então cada um dos auto-subespaços de À é invariante 
por C. Com efeito, 








vety > Av=Av> A(Cv) = C(Av) = C(Av) — Aj(Cv), 


logo Cv e E. 
Mais uma observação: se C é uma raiz quadrada não-negativa 
de À então, para cada i = 1,...,r, o único autovalor da restrição de 


Ca E é VM. Com efeito, se w € E,, é autovetor de C, digamos com 
Cw=y-wentãoAw=Aw=Cw=Yy.w,logoh = ey=vA. 
Agora o argumento final: seja C uma raiz quadrada não-negativa de 
A. Cada auto-subespaço E, é invariante pelo operador auto-adjunto 
C e o único autovalor de C em E,, é VM. Logo Cw = VA - w para 
todo w E E,,. Então, dado v= v; +---+v,, com v; E Ey,,...,Vr E Ex, 


tem-se 
Cv=vVAcvma+c dt vA cv 


portanto C coincide com o operador B acima definido. A afirmação 
sobre a positividade da raiz quadrada é óbvia. 




















Observação 1: Um dos argumentos acima usados permite mostrar 
que se dois operadores auto-adjuntos A, B comutam então eles têm 
um autovetor comum. Com efeito, seja Ay um autovalor de A. Como 
vimos acima, a hipótese AB = BA implica que o subespaço E), = 
(tv € E; Av = Nv) é invariante por B. Pelo corolário do Teorema 
13.5, o operador auto-adjunto B possui um autovetor w € E,,. Mas 
todo vetor não-nulo em E), é autovetor de A. Logo w é autovetor 
comum de À e B. Usando repetidamente o Teorema 13.2 conclui-se 
então que se dois operadores auto-adjuntos comutam então existe 
uma base ortonormal formada por autovetores de ambos. 
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Observação 2: Somente operadores não-negativos possuem raiz 
quadrada auto-adjunta, pois resulta imediatamente da definição de 
A* que o quadrado de um operador auto-adjunto é não-negativo. 
Entretanto, o quadrado de um operador de outro tipo pode ser um 
operador (auto-adjunto) negativo. Por exemplo, a rotação de 90º no 
plano tem quadrado igual à rotação de 180º, que é igual a —I. Além 
disso, um operador positivo pode ter uma raiz quadrada que não 
é auto-adjunta. Por exemplo, o operador A: R? — R?, definido por 
Alx,y) = (2x—y,3x— 2y) é uma raiz quadrada da identade Ip2, como 
se pode ver sem dificuldade. 

Exemplos gerais de operadores não-negativos são dados pelo te- 
orema seguinte. 


Teorema 13.9. Seja A:E — F uma transformação linear entre 
espaços vetoriais de dimensão finita munidos de produto interno. Os 
operadores A*A: E > Ee AA*:F > F são não-negativos e têm am- 
bos o mesmo posto de A (e de A*). Em particular, são positivos se, e 
somente se, A é invertível. 

Demonstração: Como (A*A)* = A*A** = A*A, vemos que A*A é 
auto-adjunto e, semelhantemente, AA* também. Além disso, para 
todo v E E, tem-se (A*Av,v) = (Av, Av) = |Av|? > 0 logo A*A > 0. 
Da mesma forma se vê que AA* > 0. Para determinar o posto de 
A*A, mostraremos inicialmente que N(A*A) = N'(A). A inclusão 
N(A) c N(A*A) é óbvia, pois N(A) c N'(BA) seja qual for B: F > E. 
Por outro lado, 


veN(AtA)=5 A*Av=0 
=> Ave N(A*) =Tm(A)É 
> Ave Zm(A)NTm(A), 





logo v E N(A*A) > Av = 0, ou seja N(AtA) C N(A), que é a 
inclusão restante. Em seguida observemos que, pelo Teorema do 
Núcleo e da Imagem: 


posto de A*A = dim E — dim N'(A*A) 
= dim E— dim N(A) 
= posto de A. 











A afirmação análoga sobre AA* se prova do mesmo modo. 
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Corolário. 4 transformação linear A: E > Fé injetiva se, e somente 
se, A*A é invertível. A é sobrejetiva se, e somente se, AA* é invertível. 


Com efeito, A injetiva & posto de À = dim E & posto de A*A = 
dim E & A*A invertível. Mesmo argumento para AA*. 














Observação: O Teorema 13.9 e seu corolário podem ser enuncia- 
dos em termos de matrizes, substituindo-se A por a e A* por a!. 
Nesta formulação, dizer que A é injetiva equivale a afirmar que o 
posto da matriz a e M(m x n) é igual a n. Analogamente, À ser 
sobrejetiva equivale à matriz a ter posto m. Qualquer destas duas 
hipóteses sobre A, quando formulada em termos de matrizes, pode 
ser expressa na afirmação única de que a tem posto máximo, isto é, 
o posto de a e M(m x n) é o menor dos dois números m en. Na 
prática, quando quisermos um exemplo de matriz positiva ou não- 
negativa, tomamos uma matriz a de posto máximo e consideramos 
as matrizes simétricas aa! e a!a. A maior delas é > 0 e a menor 
é >0. 


' 123 
Exemplo 13.6. Seja a = a 5 6 


| . Então as matrizes 


7 22 27 
aa! = É 7 e ala=|22 29 36|, 
27 36 45 


ambas de posto 2, são positiva e não-negativa, respectivamente. 
À seguir, uma extensão do Teorema Espectral, válida para trans- 
formações lineares quaisquer. 


Teorema 13.10. (Teorema dos Valores Singulares.) Seja A: ES5F 
uma transformação linear de posto r entre espaços de dimensão finita 


com produto interno. Existem bases ortonormais (uy,...,Un| C Ee 
(vi, ...,Vm) C Ftais que Aui = o;v; Atv; = cju;, com 0; > O para 
i=l,...,re Au =0, Atv = Osei>r. 


Demonstração: Pelo Teorema 13.9, o operador A*A: E > E é não- 
negativo e tem posto r. O Teorema Espectral assegura a existência 
de uma base ortonormal (u,..., un; C E tal que A*Au; = Gui, com 
oc>0sel<i<reoc=-0Oser+I<i<n. Então 


(Aui, Au) =— (u;, A*Au;) =— rd ELI 
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Assim, os vetores Auy,..., Au, são dois a dois ortogonais, e não- 
nulos pois 

jAu;? = cituif, 
logo |Aui| = o;. (Na realidade, a prova do Teorema 13.9 mostra que 
N(A) = N(A*A), portanto Au; = O ser + 1 <j <n.) Podemos então 














escrever, para i = 1,...,7, Au; = o;v;, onde (vj,...,v,) EC F é um 
conjunto ortonormal, de fato uma base ortonormal de Zm(A), a qual 
pode ser completada a uma base ortonormal (v,...,vm; C F, onde 
(vi. ., Vmy é uma base ortonormal de N (A*). Tem-se A*v; = 0 se 
i>re,parai=1,...,t: 
Atv; — asd — dm = OjlUi. 
i 0 

Os números positivos 07,...,0+ chamam-se os valores singulares 
da transformação linear A: E > F, de posto r. 

No teorema acima, podemos observar que (v;,...,vm) € F é uma 


base ortonormal de autovetores para o operador AA*: F — F, pois 
(AA*)vi; = A(ojui;) = c;Aui =— Oi vi. 


Analogamente, (u1,..., un); E E é uma base ortonormal de autoveto- 
res do operador A*A: E > E. 

Vemos ainda que (u,...,ur) é uma base ortonormal de Tm(A*), 
enquanto o conjunto ortonormal (v;,...,vr| é uma base para Zm(A). 
Ao mesmo tempo, (u,,1,...,Un) CN(A) e fvr1,...,Vm) CN(A*) são 
bases, desde que não sejam vazios. 


Exercícios 


Em todos os exercícios desta seção E é um espaço vetorial de di- 
mensão finita, munido de produto interno. 


13.1. Prove que duas projeções P, Q: E > E são iguais se, e somente 
se, têm os mesmos auto-vetores com os mesmos auto-valores. Con- 
clua que uma projeção P: E > E é auto-adjunta (portanto Zm(P) = 
N'(P)+) se, e somente se, é normal. (Veja Exerc. 12.7.) 


13.2. Sejam A,B: E — E operadores auto-adjuntos tais que 
(Av,v) = (Bv,v) para todo v E E. Prove que À = B. 
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13.3. Se B é invertível e BAB* é auto-adjunto, prove que À é auto- 
adjunto. 


13.4. Sejam P uma projeção ortogonal e « > O. Exprima a raiz 
quadrada positiva de I+ «P em termos de P. 


13.5. Seja A auto-adjunto. Prove que A*v = 0 implica Av = 0. 


13.6. Assinale se cada um dos seguintes subconjuntos do espaço 
vetorial L(E) é um subespaço vetorial (S), um cone (C), um cone con- 
vexo (CC): 


( ) operadores normais (Veja Exerc. 12.7.) 
( ) operadores auto-adjuntos 
( ) operadores não-negativos 


( ) homotetias. 


13.7. Sejam S,T E £(E) involuções auto-adjuntas. Prove que ST é 
uma involução auto-adjunta se, e somente se, ST = TS. 


13.8. Dados os vetores v = (2,—-1,-2), e w = (3,6, —6), determine 
o operador auto-adjunto A: Rº — Rº tal que Av = (1,1,13) e Aw = 
(3,21,33), sabendo que o traço de À é 5. 


13.9. Dados os vetoresu = (4,4,-2), v = (4,-2,4) e w = (1,-2, 
—2), seja A:Rº* — Rº o operador linear tal que Au = (10,-2,-2), 
Av = (-2,10,-2) e Aw = (1,1,-5). Prove que À é auto-adjunto. 


13.10. Dado o subespaço F C E, considere as transformações lineares 
P:EESFeJ:F> E, onde P é a projeção ortogonal (de núcleo Fl!) e 
Jv = v para todo v € F. (] chama-se a inclusão de F em E.) Determine 
as adjuntas P*:F> Ee J*t: ES F. 


13.11. Seja A: E > E o operador de posto 1 definido por Av = (v,a)b. 
(E é um espaço vetorial de dimensão finita, com produto interno, e 
a,b E E são vetores não-nulos.) Prove que À é auto-adjunto se, e 
somente se, b é múltiplo de a. Além disso, A é não-negativo se, e 
somente se, pode-se tomar b = a. Dada uma base ortonormal em E, 
determine a matriz de A em função das coordenadas de a e b nessa 
base. (Veja Exercício 10.32.) 
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13.12. Se A*A = —A, prove que os autovalores de A pertencem ao 
conjunto (0, —1). Dê exemplo de uma matriz a e M(2 x 2), tal que 
1 = — eala=-a. Quantas dessas matrizes existem? 


13.13. Seja A: E > E auto-adjunto. Para todo k E N ímpar, mostre 
que existe um único operador auto-adjunto X: E» Etal que X* = A. 
Se k é par, existe X auto-adjunto com X* = A se, e somente se, À > 0. 
Neste caso, X pode ser escolhido > 0 e então é único. 


13.14. Assinale V(erdadeiro) ou F(also): 


( ) Se todos os elementos de uma matriz simétrica são números 
positivos então essa matriz é não-negativa. 


( ) O produto de operadores não-negativos é um operador não-ne- 
gativo. 


( ) Um operador não-negativo é positivo ou é zero. 


( ) Uma matriz do tipo [a; - b;] é não-negativa se, e somente se, 
a; = b; (para todo i). 


( ) O posto de uma matriz não-negativa n x n pode ser qualquer 
número de lan. 


( ) O inverso de um operador auto-adjunto (invertível) também é 
auto-adjunto. 


( ) Se existirem u,v E Rº não-nulos, com Au = 2u, Av = 3v 
então existe uma base de autovetores para o operador linear 
A:Rê SR. 


( ) Sejam (,) e [, ] produtos internos definidos em R?. Se um 
operador À é auto-adjunto relativamente a (, ) então À tam- 
bém é auto-adjunto em relação a [, 1. 


13.15. Se o espaço vetorial E possui uma base formada por autove- 
tores do operador A: E > E, prove que é possível definir em E um 
produto interno em relação ao qual À é auto-adjunto. 


13.16. Num espaço vetorial E, de dimensão finita, seja A um opera- 
dor diagonalizável (ou seja, E possui uma base formada por autove- 
tores de A). Se F c E é um subespaço invariante por A, prove que 
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a restrição de À ao subespaço F é um operador diagonalizável em F. 
(Sugestão: use o exercício anterior.) 


13.17. Seja A: E > E um operador diagonalizável. Se o subespaço 
KH c E é invariante por A, prove que existe um subespaço F; C E, 
também invariante por A, tal que E = F, & E. 


13.18. Se os operadores A,B: E — E são auto-adjuntos, prove que 
AB + BA é auto-adjunto. Que se pode dizer sobre AB — BA? 


13.19. Se A: E > E é auto-adjunto, prove que, para todo Be Z(E), o 
operador B*AB também é auto-adjunto. Se À > 0, prove que B*AB > 
0. Se A >0€e B é invertível, prove que B*AB > 0. 


13.20. Se dois operadores auto-adjuntos A,B: E — E comutam, 
prove que o espaço E possui uma base ortonormal formada por auto- 
vetores comuns a À e B. Prove também a recíproca. 


13.21. Assinale V(erdadeiro) ou F(also): 


( ) O conjunto dos operadores positivos é um cone convexo no es- 
paço vetorial L(E). 


( ) O conjunto dos operadores não-negativos é um subespaço veto- 
rial de £(E). 


( ) Os elementos da diagonal de uma matriz positiva são números 
positivos. 


( ) Se À é auto-adjunto e B é invertível então B”! AB é auto-adjunto. 


( ) Existe uma matriz positiva 2 x 2 com dois elementos negativos 
e dois positivos. 


( )Se A:R" > R” é um operador invertível qualquer, alguma 
base ortogonal de R” é transformada por À numa base ortogo- 
nal. 


( ) Se o operador A é auto-adjunto então o traço de À é igual à 


soma dos seus autovalores. 


13.22. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Um subconjunto » c E chama-se um elipsóide quando 
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existem uma base ortonormal (u,...,un) C E e números positivos 
a1,..., On tais que X é o conjunto dos vetores v = xjuy + --: + XnUh 
cujas coordenadas x; satisfazem a equação ax? +--+ax =1. 
Seja A: E > E um operador invertível. Prove que todo elipsóide X é 
transformado por A num elipsóide >”. 

(Sugestão: use o Teorema 13.10.) 


13.23. Seja » um subconjunto de um espaço vetorial de dimensão 
finita, com produto interno. Prove que > é um elipsóide se, e somente 
se, existe um operador positivo A: E > E tal que 


L=iv6 ElAvv= ld. 


13.24. Num espaço vetorial E, de dimensão finita, com produto in- 
terno (u,v), seja B um operador positivo. Prove que [u,v] = (Bu, v) 
define um novo produto interno em E. Se A: E 5 E é auto-adjunto 
no sentido do produto interno original, prove que À é também auto- 
adjunto no sentido do novo produto interno se, e somente se, 
AB — BA. 


13.25. Sejam A: E > E auto-adjunto e B: E > E positivo. Prove: 


(a) Se X é a raiz quadrada positiva de B então XAX é auto-adjunto. 
(b) v é autovetor de XAX se, e somente se, Xv é autovetor de BA. 


(c) E possui uma base (não necessariamente ortogonal) de autove- 
tores de BA. (Ou seja, BA é diagonalizável.) 


13.26. Se A: E > E é auto-adjunto e B: E > E é positivo, prove que 
E possui uma base V tal que, para todo v E V, existe À E R com 
Av = ABv. (“Problema de autovalores generalizados”.) 


13.27. Sejam A, B operadores auto-adjuntos no mesmo espaço veto- 
rial. Se BA é diagonalizável, prove que AB também é diagonalizável. 
(Veja Exercício 12.35.) 

13.28. Dada a transformação linear A: E > F, entre espaços veto- 
riais de dimensão finita munidos de produto interno, seja 0? o maior 
autovalor do operador A*A: E > E (o > 0). Prove que o é o maior 
dos números |Aul, onde u é qualquer vetor unitário em E. Escreve- 
se |All = o = max(|Aul;u € E, jul = 1) e diz-se que ||Al| é a norma 
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espectral da transformação linear A. Seja |A| = «/tr(A*A) a norma 
induzida pelo produto interno (A, B) = tr(A*B), definido no Exercício 
ILE Ser, as o2 são os autovalores de A*A, tem-se 


IAl= Var +oR e I/All=max o;. 


Conclua que ||JA|| < |A| < yn.IAl. 


13.29. Prove que todo operador auto-adjunto A: E — E pode ser 
escrito como À = AP, +--- + AmPm onde: 


(dy E Aga 


(2) Pj =P, =Pj,...,Pa = Pm = Ph. (Cada P; é uma projeção 
ortogonal.) 


(3) PiP;=O sei Zj. 
(4) P4+-+Pa=L 


Prove também que a expressão À = LA;P; com as propriedades 
(1) a (4) acima é única. (Sugestão: A <--- < Am são os autovalores 
distintos de À e P; é a projeção ortogonal sobre o auto-espaço E,,, 
definido no Exercício 12.23.) 


13.30. Prove que todo operador auto-adjunto é soma de operadores 
auto-adjuntos de posto 1, os quais podem ser tomados não-negativos 
se À for não-negativo. [Sugestão: Teorema Espectral.] 


13.31. Chama-se produto de Hadamard de duas matrizes a = la], 
b = [bi] E M(m x n) à matriz € = [ci] [e M(m x n) com Ci; = di * Bj. 
Prove que o produto de Hadamard de duas matrizes não-negativas 
é uma matriz não-negativa. (Use o fato de que toda matriz não- 
negativa pode escrever-se como soma 


a= > a” 
T 


de matrizes não-negativas de posto 1, cada uma das quais tem a 


forma al”! = [aí” a.) (Veja o exercício anterior.) 
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13.32. Prove que a norma espectral, definida no Exercício 13.18, tem 
as propriedades 


IA + BI < IJAI+ BI e IIBAI < IJBILAI. 


Dê exemplo de um operador A:R? — Rº para o qual se tem 
IA2|| < IJAIP. 


13.33. Prove que a norma |A| = «/tr(A*A), proveniente do pro- 
duto interno introduzido no Exercício 11.17, cumpre a desigualdade 
IBA| < IBIJAI. 


13.34. Seja A: E > E auto-adjunto. Seu ce E étal que Au Z0e 
(Au,u) = 0, mostre que existem v,w € E com (Av,v) > 0e (Aw,w) < 
0. Deduza daí o Cor. 1 do Teor. 13.7 sem usar o Teorema Espectral. 
(Sugestão: considere tu + Au para valores convenientes de t.) 


14 


Operadores Ortogonais 


Sob o ponto de vista da organização geral da Matemática, os opera- 
dores ortogonais são os automorfismos da estrutura de espaço veto- 
rial com produto interno, ou seja, são as simetrias dessa estrutura. 
Do ponto de vista mais pedestre em que nos colocamos, os operadores 
ortogonais são aqueles para os quais se podem obter as matrizes mais 
simples, depois dos auto-adjuntos. Eles possuem as propriedades 
geométricas mais marcantes, muitas das quais lhes são exclusivas. 
(Vide Teorema 14.1.) Nesta seção consideramos, mais geralmente, as 
transformações lineares ortogonais de um espaço noutro e as matri- 
zes ortogonais não-quadradas. Obtemos a forma mais simples que 
pode assumir a matriz de um operador ortogonal e concluímos de- 
monstrando que todo operador é o produto de um não- negativo por 
um ortogonal (forma polar). 


Nesta seção, estenderemos para espaços vetoriais com produto 
interno a noção de congruência entre figuras da Geometria Elemen- 
tar. Lembramos que uma congruência entre duas figuras X, Y é uma 
bijeção f:X — Y que preserva distâncias, isto é, tal que 
d(f(x),f(x)) = d(x,x') para quaisquer x,x” € X. Note-se que, 
embora não garanta a sobrejetividade, a propriedade de preservar 
distâncias já assegura que f é injetiva pois f(x) = f(x) > d(x,x) = 
difixitixj-0=>4=*; 
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Na discussão a seguir, um papel central é desempenhado pelos 
conjuntos ortonormais (u1,...,Um; CR”. Umamatrizu € M(mxn) 
cujas n colunas formam um conjunto ortonormal em R” chama-se 
uma matriz ortogonal. 


Se u1,..., Un € R” são as colunas da matriz u = [a;]e M(mxn), 
a condição para que u seja ortogonal é que (u;,u;) = O sei je 
(ui, ui) = 1, onde 1,j = 1,...,n1. Noutras palavras, deve-se ter 


m 
z. Ai Ok = dj. (E) 
k=1 


(Estamos usando aqui, mais uma vez, o símbolo 6;;, conhecido como 
“delta de Kronecker”, que vale 0 sei Zj e 1 sei =.) A igualdade (*) 
significa precisamente que o produto u! .u da transposta u! por u é 
igual à matriz identidade n x n. 


Portanto a matriz u € M(m x n) é ortogonal se, e somente se, 


Tu=l. 


u 


Seu e M(m x n) é ortogonal então seu posto é n (logo m > mn), 
pois suas n colunas são vetores L.I. no espaço R”. Quando m =n e 
u ce M(nxn) é uma matriz quadrada ortogonal então a igualdade 
u".u= LI, implcau-u! = I, logou! = wu”. (Vide Corolário do 
Teorema 6.7 ou a propriedade 7) do produto de matrizes na Seção 8.) 
Assim, matrizes quadradas ortogonais são aquelas cuja transposta 
é igual à inversa. 


A igualdade u -u! = I, significa que as linhas de u formam um 
conjunto de n vetores ortonormais em R”. Portanto, para matrizes 
quadradas, colunas ortonormais equivale a linhas ortonormais. 


Seu e M(n xp), v € M(m xn) são ortogonais então (vu)! vu 


=ulv'vu=u'lu = ulu = I logo o produto vu é ortogonal. Se 
ucM(nxn)éortogonalentão (u!)'.ul=u-u! =I,logou! =u”! 


também é ortogonal. 
Evidentemente, se m > n, as m linhas de uma matriz ortogonal 


u ce M(m xn) não podem formar um conjunto ortonormal pois são 
vetores em R”, logo u! não é ortogonal quando u não é quadrada. 
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Exemplo 14.1. A matriz u, cujas colunas são os vetores 
ais 72 
p= 3º 3) 3 , 
is E dia e 
ola as 


e q 
à pla 3'3' 3 , 


Exemplo 14.2. (Matrizes ortogonais 2 x 2.) Seja 


é ortogonal. 


u=|* b 

“lcd 
uma matriz ortogonal 2 x 2. Como u; = (a,c) é um vetor unitário 
em Rº, existe 0 € R tal que a = cos 0, c = sen 0. Sendo up = (b,d) 
unitário e perpendicular a u;, devemos ter uz = +(— sen 0, cos 0). 





Assim, há duas possibilidades para a matriz u: 





“ |cos0 —sen O “ |cos0 senô 
= ps O cos0 | em = fa O —cos o 
No primeiro caso, tem-se ad — bc = 1 e no segundo ad — be = —1. 
No primeiro caso, o polinômio característico de u, p(A) = Nº — 
(2 cos 0)A + 1, não tem raízes reais salvo se 0 = 0 ou O = 180º, casos 
em que u = +L. Trata-se da matriz de uma rotação. No segundo 





caso, p(A) = A? — 1 tem raízes +1. Então o operador U: R? > R? cuja 
matriz (na base canônica) é u admite autovetores v;, vz, com Uv; — 
vi e Uvz = —v,. Observe que, neste caso, a matriz u é simétrica, o 
operador U é auto-adjunto, [v1,v2) C Rº é uma base ortonormal e U 
é a reflexão em torno do eixo que contém v;, paralelamente a vz. 


Exemplo 14.3. (Matriz de passagem ortogonal.) Sejam U = 


tur,...,Un) CEeU! = (u,...;u,) C E bases ortonormais. A ma- 
triz de passagem p = [pi] de U para U' é uma matriz ortogonal. 
Com efeito, para quaisquer i,j = 1,...,n, temos 


n n 
/ / 
WU = > pa e u; = > rom 
k=1 k=1 
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logo 
n 
dy = (uLu) => pupyo 
k=1 


portanto p! .p = L,. As últimas 2 igualdades da linha acima mos- 
tram que, reciprocamente, se a matriz de passagem p é ortogonal, 
então U ortonormal > U' ortonormal. 


Teorema 14.1. As seguintes afirmações a respeito de uma trans- 
formação linear A: E > F, entre espaços vetoriais de dimensão finita 
providos de produto interno, são equivalentes: 


(1) A preserva norma: |Av| = |v| para todo v E E; 
(2) A preserva distância: |Au— Av| = |u—v| para quaisquer u,v € E; 


(3) A preserva produto interno: (Au, Av) = (u,v) para quaisquer 
uve E; 


(4) A*A = Tg; 


(5) A matriz de A relativa a qualquer par de bases ortonormais 
UcEVcFéuma matriz ortogonal; 


(6) A matriz de A relativa a um certo par de bases ortonormais 
UcEVcFéuma matriz ortogonal. 


(7) A transforma uma certa base ortonormal U C E num conjunto 
ortonormal X Cc F. (Se dim E = dim F, X é uma base.) 


(8) A transforma toda base ortonormal W c E num conjunto orto- 


normal Z C F. 


Demonstração: Se vale (1) então |Au — Av| = |A(u — v)| = Ju — vl, 
logo (1) > (2). Se vale (2) então 





1 
(Au, Av) = > [IAuÉ + |AvÉ = |Au — Avf] 





] 
= 5[luP + flu vê] = (u,v), 


logo (2) > (3). Se vale (3) então, para quaisquer u,v € E tem-se 
(u,v) = (Au, Av) = (A*Au,v), portanto A*Au = u para todo u E E, 
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donde A*A = Ie, logo (3) > (4). Se vale (4) e a é a matriz de À nas 
bases ortonormaisU CE,V cFentãoa! .a = LI, e a é uma matriz 
ortogonal, logo (4) > (5). Obviamente (5) > (6). Se vale (6), sejam 

= (u1,...,Un), V=(vi,...,Vm)e a = la] a matriz ortogonal de A 
nessas bases. De 


m m 
Aui — pa aAkiVk € Au; — a AkjVk 

k=1 = 

resulta 
(Aui, Aus) > A dk = di, 

logo Y = (x1,...,Xn) C F, com x; = a é um conjunto ortonormal e 
(6) > (7). Se vale (7), seja W = (wy,...,/n) C E uma base ortonor- 
mal qualquer. Para 1,j) = 1,...,n, temos 


E > pau e Ww = > Po 
k k 


onde a matriz de passagem p — (pi;) é ortogonal, pelo Exemplo 14.3. 


Pondo Z = (z1,...,Zn), onde z; = Aw;, vem, para i,j=1,...,n: 
n Tt n 
= Do priÃu = 3. PuXxk e Z= >. PkjXk 
k=1 k=1 k=1 
Como X =(x1,...,xn) é ortonormal, resulta daí que 


(Zi, Zj) -, PkiPk — di; , 


logo Z é ortonormal e (7) => (8). 
Finalmente, se vale (8), seja U = (w,...,um) C E uma base ortonor- 
mal. Para todo u — «ju; + --- + «nun € E tem-se 


n 
2 2 
uf=53 4. 
i=1 


Como (Auy,..., Aun) E F é um conjunto ortonormal, 


n 


2 2 
= >. A — [ul , 
i=] 


Auf = ; Au; 
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logo |Aul = jul e (8) > (1). 





Observação. O Teorema 14.1 confirma o dito: enunciado longo => 
demonstração fácil. (Dito válido com a mesma precisão e generali- 
dade com que costumam valer os provérbios.) 

Uma transformação linear A: E > F chama-se ortogonal quando 
cumpre uma das oito condições do Teorema 14.1 (e portanto todas 
elas). Em particular, um operador linear A: E — E chama-se orto- 
gonal quando A* — A”!. Para que o operador linear A: E > E seja 
ortogonal, é suficiente que A*A = I; ou então que AA* = Ir. 

De |Av| = |v| resulta que os únicos autovalores possíveis para um 
operador ortogonal A: E > E são +] e —1. Com efeito, Av = Av com 
v O implica |v| = |Av| = |Av| = |Al |v, logo |A| = 1. 

Se u e v são autovetores do operador ortogonal A, com Au = ue 
Av = —v então (u,v) = 0. Com efeito: 


(u,v) = (Au,—Av) = (A*Au, —v) = (u,—v) = — (u,v). 


Teorema 14.2. Se o operador ortogonal A: E > E deixa invariante 
o subespaço F C E então A deixa invariante o complemento ortogo- 
nal Fl. 


Demonstração: Dado arbitrariamente w € F+, queremos provar 
que Aw € F4, isto é, que (Aw,v) = O para todo v E F. Ora, a restrição 
de À ao subespaço invariante F é um operador injetivo A: F — F, logo 
sobrejetivo. Assim, dado v E F, existe u E Ftal que v = Au. Logo 
(Aw,v) = (Aw, Au) = (wu) = 0, pois we Fleu e F. 














Observação. Parte do argumento acima mostra que se o operador 

A: E > EéinvertiveleF c E é invariante por À, então F é invariante 
el 

por A”. 


Exemplo 14.4. Uma operador linear S: E — E que é ao mesmo 
tempo ortogonal e auto-adjunto cumpre S*S = Ie S* ='S, logo 
SS = I. Portanto ortogonal + auto-adjunto => involução. Pelo Te- 
orema 7.3, tem-se E = KH &F, onde F, = (ve ESv=viehb = (ve 
E;Sv = —v). Assim, os elementos não-nulos de F, e F; são os autoveto- 
res de S correspondentes aos autovalores +1 e —1 respectivamente. 
Da observação que precede o Teorema 14.2 resulta que F; = (Fj)+. 
Juntando-se uma base ortonormal de F; com uma base ortonormal 
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de F; obtém-se uma base ortonormal de E em relação à qual a ma- 
triz de S é diagonal, com a diagonal da forma (1,...,1,—1,...,—1). 
O operador S é uma reflexão ortogonal. O leitor pode verificar sem 
dificuldade que duas quaisquer das seguintes propriedades de um 
operador linear S: E — E implicam a terceira: (a) SS = I; (b)S* =S; 
(o) St =5". 

Em seguida, examinaremos como pode ser um operador ortogo- 
nal A: E — E num espaço vetorial de dimensão 2, dotado de um 
produto interno. 

Segundo a natureza dos autovalores de A, há quatro possibilida- 
des: 


(1) À possui um único autovalor, o qual é igual a 1. Neste caso, À = 1. 

Com efeito, seja u € E um vetor unitário tal que Au =u. Sev e E 
é outro vetor unitário, perpendicular a u, então Av também é um 
vetor unitário perpendicular a u, pelo Teorema 14.2, logo Av = +v. 
Como A não admite o autovalor —1, deve ser Av = v. Mas (u,v) EC E 
é uma base, portanto À = 1. 


(2) À possui um único autovalor, o qual é igual a —1. Então À = —I. 
O raciocínio é inteiramente análogo ao anterior. 


(3) À admite os autovalores 1e —1. Então tomamos vetores unitários 
u,v € Ecom Au =ue Av = —v, logo (u,v) € E é uma base ortonor- 
mal, relativamente à qual a matriz de À é 


o a): 


Neste caso, À é a reflexão ortogonal em torno do eixo que contém o 
vetor u. 


(4) A não possui autovalores (reais). 

Então tomamos uma base ortonormal arbitrária (u,v) C E. A 
matriz de À nesta base, sendo ortogonal 2 x 2 sem autovalores, tem, 
segundo o Exemplo 14.2, a forma 


“ |cos0 —sen O 
“ |sen0 cos0 


Somos tentados a dizer que, neste caso, o operador A:E >= E é a 
rotação de ângulo 0. Mas para isso é necessário verificar se O não 
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depende da base ortonormal YU = (u,v)] C E escolhida. Ora, se tomar- 
mos outra base ortonormal U' = (u',v) € E, a nova matriz de À será 


a'=p !ap, onde 
= é b 
Pp — c d , 


matriz de passagem de U para U”, é ortogonal, logo p ! = p!. Assim, 
d=|! cl |Icos0 -—sen0| ja b 
“Ib d| |sen0O coso cd 
Levando em conta a ortonormalidade das linhas e das colunas da 
matriz p, um cálculo fácil mostra que se tem 


abs cos 0 —sen 0 
“ |sen0 cos0 


ou 
a = | eos O sen0| | |cos(-0) -—sen(-0) 
“ |-sen0 cos0| | l|sen(-0) cos(—0) 
conforme seja ad — bc = 1 ou ad — bc = —1 respectivamente. 


Noutras palavras, o ângulo O fica determinado a menos do sinal. 
Isto quer dizer que, num espaço vetorial de dimensão 2, munido de 
produto interno, faz sentido a noção de ângulo apenas em valor abso- 
luto. Para que se possa falar no ângulo dotado de sinal é preciso in- 
troduzir uma orientação em E, isto é, escolher uma base ortonormal 
(u,v) € E, chamá-la de positiva e declarar que são também positi- 
vas todas as bases ortonormais de E que se obtêm a partir desta por 
meio de matrizes de passagem ortogonais cujo determinante ad — be 
é igual a 1. De qualquer modo, com ou sem orientação, os opera- 
dores ortogonais sem autovalores (juntamente com +1) num espaço 
vetorial de dimensão 2 serão chamados rotações. (Ie —I são respec- 
tivamente as rotações de ângulo 0º e 180º respectivamente.) 


Teorema 14.3. Seja A: E > E um operador ortogonal num espaço 
vetorial de dimensão finita munido de produto interno. Existe uma 
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base ortonormal de E relativamente à qual a matriz de A tem a forma 


— 
cos «y —sen q 
sen «| cosa 


cos «x —sen ox 
sen ox Cos ox 


LO WDlWwDw—Ww—w——w———— 


onde os termos não aludidos são iguais a zero. 


Demonstração: Os conjuntos H = (ve EAÃv = vie = (v € 
E; Av = —v; são subespaços vetoriais invariantes por A, com F N 
F = (0J. Logo F = H & É também é um subespaço invariante por 
A, o mesmo acontecendo com o complemento ortogonal Fl. Seja 
(uy,...,Uy) C F uma base ortonormal cujos primeiros vetores for- 
mam uma base de F, e os restantes uma base de F;. Nenhum su- 
bespaço de dimensão 1 em F- é invariante por A, logo existe um 
subespaço invariante G C Fl de dimensão 2. Seja (v;,w1] C G uma 
base ortonormal. Como vimos acima, tem-se Av; — cos ay «vi + 
sen «| - wj, Aw| = —sen «| - vi + cos « - wj. Novamente, o com- 
plemento ortogonal de G em F- é um subespaço invariante por A, 
que não possui autovetores, logo contém um subespaço invariante 
de dimensão 2. Prosseguindo analogamente, chegaremos a uma 


base ortonormal (vi, w1,...,Vb Wk) C Fl tal que Av; = cos qjvi + 
sen «;v; e Aw; = —sen q;v; + cos a;w; para i = 1,...,k. Então 
(ums Us VD WI...» Vo Wk) EC E é uma base ortonormal, relativa- 











mente à qual a matriz de À tem a forma desejada. 





Observação. A matriz a que se refere o Teorema 14.3 pode não 
possuir elementos iguais a 1, ou a —1, como pode também não conter 
nenhum dos blocos 2x2, característicos de rotações. Além disso, caso 
seja conveniente, cada bloco igual a 1 ou a —I pode ser substituído 
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respectivamente pelos blocos 


cos 0 -—sen 0 cos TT -—sen7 

ou 
sen O cos0 sen 7 cosa 

Corolário. Se E tem dimensão ímpar, todo operador ortogonal 

A: ES E possui um autovetor v, com Av = vou Av = —. 


Exemplo 14.5. Seja A: Rê — Rº um operador ortogonal no espaço 
euclidiano tri-dimensional. Se À £ +I então existe uma base orto- 
normal (ui, u2,u3) C Rº em relação à qual a matriz de A tem uma 
das quatro formas abaixo: 


10 0 1 0 0 

01 01,10 —1 0 |, 

00 —1 0 0 —1 
1 0 0 — 0 0 
O cosa -—sena|, |O cosa —sen a 
O sena cosa O sena cosa 


No primeiro caso À é a reflexão em torno do plano que contém os 
vetores uy, uz (paralelamente a 3). No segundo caso, À é a reflexão 
em torno do eixo que contém u; ou, o que é o mesmo, a rotação de 
180º em torno desse eixo. No terceiro caso, À é a rotação de ângulo 
« em torno do eixo que contém uj. No último caso, À é essa rotação 
seguida da reflexão em torno do plano que contém wu, e us. Estas 
quatro possibilidades, mais A = Ie À = —lI, esgotam todos os tipos 
de operadores ortogonais em Rº. 


Teorema 14.4. Seja E um espaço vetorial de dimensão finita, mu- 
nido de produto interno. Todo operador linear A: E > E admite 
uma decomposição da forma A = PU, onde U: E > E é ortogonal e 
P: E > Eé não-negativo. 


Demonstração: De acordo com o Teorema 13.10, existem bases or- 
tonormais (1,...,Un: C E, (vi,...,Vn) C E e números À; > 0 tais que 
Au; = A;v; para i = 1,...,n. Definamos os operadores PU: E > E 
impondo que Pv; = A;v; e Uu; = v;. Evidentemente, P é auto-adjunto, 
> 0,U éortogonale PU = A. 














A expressão À = PU chama-se uma decomposição polar do ope- 
rador A, por analogia com a forma polar z = rei? de um número 
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complexo. Os fatores P e U são univocamente determinados a partir 
de A, no caso em que À é invertível. Provemos isto. É claro que 
A invertível obriga P a ser também invertível, donde positivo. De 
A = PU tiramos A* = U*P e, multiplicando membro a membro estas 
igualdades, vem AA* = PUU*P = P2, portanto P é a raiz quadrada 
positiva do operador positivo AA*. (Vide Teorema 13.8.) Multipli- 
cando a igualdade A = PU por P”! à esquerda, vem U = PIA. Isto 
mostra que, no caso em que A é invertível, P= VAA*eU = PIA 
são univocamente determinados a partir da igualdade A = PU. 


Exercícios 


14.1. Prove que as linhas de uma matriz a são duas a duas orto- 
gonais se, e somente se, aa! = d, onde d é uma matriz diagonal. 
Enuncie e prove um resultado análogo sobre a ortogonalidade das 
colunas de a. 


14.2. Se as linhas de uma matriz quadrada forem duas a duas orto- 
gonais e tiverem a mesma norma, prove que as colunas dessa matriz 
também são duas a duas ortogonais. 


14.3. Dê os seguintes exemplos: 


(a) Uma matriz invertível cujas linhas são duas a duas ortogonais 
mas as colunas não são. 


(b) Uma matriz (não-quadrada) cujas linhas são ortogonais e têm 
a mesma norma mas as colunas não são ortogonais. 


(c) Uma matriz cujas linhas (e colunas) são duas a duas ortogonais 
mas as normas das linhas são diferentes. 


14.4. Seja f: R? — R” uma função tal que f(0) = O e lf(u) — f(v)| = 
[ju — v| para quaisquer u,v € R”. (Ou seja: f deixa O fixo e preserva 
distâncias.) Prove: 


(a) Para todo v E R", tem-se |f(v)| = |vl. 


(b) Para quaisquer u,v € R”, tem-se (f(u), f(v)) = (u,v). [Use a 
igualdade (u,v) = !(lu? + |v2 — ju — v/?).] 
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(c) Os vetores u; = f(ej),...,un = f(en) formam uma base orto- 
normal em R?. 


(d) Para todo v = x,ey +--- + xnen E R”, tem-se (f(v), u;) = xi, logo 
f(v) = xy +: + Xl. 


(e) f:R" > R” é um operador linear, logo é ortogonal. 


Uma função g: R” — R” chama-se uma isometria quando |g(u) — 
g(v)| = lu — v| para quaisquer u,v € R?. Conclua que toda isometria 
tem a forma g(v) = A-v+b, onde A: R” — R” é um operador (linear) 
ortogonal e b € R” é um vetor constante (independente de v). 














14.5. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Se Ao: F — E é uma transformação linear ortogonal defi- 
nida num subespaço vetorial F € E, prove que existe um operador 
ortogonal A: E > Etal que À -v= A, -v para todo v E F. 


14.6. Sejam A:F > Ge B:F > H transformações lineares in- 
vertíveis. (G e H são espaços de dimensão finita, munidos de produto 
interno.) Prove que existe uma transformação ortogonal (invertível) 
C: 6 >» H com B = CA se, e somente se, |Av| = |Bv| para todo v E F. 


14.7. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Dados dois operadores A,B: E — E tais que |Av| = |Bvl 
para todo v E E, prove que existe C: E > E ortogonal, com B = 
CA. (Sugestão: observe que (A) = N'(B). Considere F = N'(A)+ 
e sejam Aç: F > Zm(A), Bo: F — Zm(B) os isomorfismos obtidos 
por restrição de A e B respectivamente. Use o exercício anterior 
para achar Co: ZTm(A) — Zm(B), com B, = C5Ã, e obtenha C pelo 
Exercício 14.5.) 


14.8. Dada uma base ortonormal (u,,u2,u3) C Rº, sejam n,p E N 
tais que p = nº 4+n +41. Defina um operador A: Rê — Rº pondo 
Au, = v1, Auz = v2, Aus = v3, onde 

















1 

vI= 5 nu + (n + Du +n(n + Duz), 
1 

vi = 5 n(n + Du, + nu — (n + Dus], 
1 

V3 = p (n + Du —n(n + Du + nus]. 
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Prove que o operador À é ortogonal. 


14.9. Para quaisquer duas bases ortonormais U = (w,..., jun) CEe 
V=(v3,...,Vn) EC E, prove que existe um operador ortogonal A: E > 
E tal que Au, = v3,..., Aun = vn. Se as bases dadas são formadas 
pelos vetores 


] = a 
9 "8 3 

] ] I 

VI = 712,3, 6), w= 716, 2, =3), Va = 7(3,—6,2) em Rº, 


— 
— 


U1 = q uz (21,21, Us — (2,=2,1) e 


determine a matriz de A na base canônica de Rº. 


14.10. Dado o vetor unitário u € R”, prove que o operador Hj: R” > 
R”, definido por H,.v=v—2 (v,u)u, é ortogonal. (Reflexão em torno 
de full.) Dados os vetores v 2 w em R”, com |v| = |w|, mostre que, 
tomando u = (v— w)/|v — wl, tem-se Hyv = w. Determine a matriz 
de H, em função das coordenadas de u (“matriz de Householder”). 


14.11. Prove que todo operador A: E > E, num espaço vetorial de 
dimensão finita munido de produto interno se escreve como À = UP, 
onde U é ortogonal e P é não-negativo. (Faça a decomposição polar 
de A+.) 


14.12. Com a notação do Exercício 11.17, considere um operador 
ortogonal À e £(E) e defina Ma: L(E) > £(E) pondo Ma - X = AX. 
Prove que Ma é um operador ortogonal. 


14.13. Se uma matriz ortogonal é triangular, prove que ela é diago- 
nal e seu quadrado é igual à matriz identidade. 


14.14. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Uma função S: E — E chama-se uma semelhança quando 
existe um número r > O (chamado a razão de semelhança) tal que 
IS(u)—S(v)| = rlu—v| para quaisquer u, v € E. Se S é uma semelhança 
de razão r, prove que existem um operador ortogonal A: E > E e um 
vetor b € E tais que S(v) = r.Av +b para todo v E E. 


14.15. Seja A: E — E um operador linear que transforma vetores 
unitários em vetores unitários. Prove que À é ortogonal. Deduza 
daí que se S: E > E é um operador linear invertível que transforma 
dois quaisquer vetores de mesmo comprimento em vetores de mesmo 
comprimento então S é uma semelhança. 
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14.16. Seja S: E — E um operador linear invertível que preserva 
ângulos, isto é 

(Su, Sv) (uv) 

ISul|Sv|  tulfvl 





quando u <0ev 0. Prove que S transforma vetores ortogonais de 
mesmo comprimento em vetores ortogonais de igual comprimento. 
Conclua que S é uma semelhança. 


14.17. Com o produto interno introduzido no Exercício 11.17, prove 
que os operadores ortogonais têm norma igual a /n, onde n= dim E. 


14.18. Se a decomposição polar de um operador é única, prove que 
esse operador é invertível. 


14.19. Seja A:Rº — Rº dado por A(x,y,z) = (2x + 3y — 6z,6x + 
2y + 3z,—3x + 6y + 2z). Mostre que A é uma semelhança de razão 
7. Sabe-se que ou existe v € Rº com Av = 7v ou existe w E Rº 
com Aw = —7w. Ache um autovetor de A, complete-o de modo a 
obter uma base ortonormal de Rº e determine a matriz do operador 
A nesta base. 


14.20. Seja a = [0,07 ...anl E M(I x n) tal que at +... + =, 
Prove que ala € M(n x n) é a matriz de uma projeção ortogonal. 
Determine a imagem e o núcleo dessa projeção. 


14.20. Pode uma matriz ortogonal ser anti-simétrica? 
14.21. Seja a uma matriz ortogonaln x n. 
(a) Prove que A: M(n x n) > M(n x n), definida por Ax = ax! + 


xa”, é uma transformação linear cuja imagem é o conjunto das 
matrizes simétricas. 


(b) Prove que, dada uma matriz simétricas € M(nxn), o conjunto 
das matrizes x tais que ax! + xa! — s é uma variedade afim de 
dimensão n(n — 1)/2 no espaço vetorial M(n x n). 


14.22. Ache uma matriz ortogonal 4 x 4 cujos elementos são todos 
da forma +1. 
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14.23. Seja v = (a,b,c) um vetor unitário diferente de +es. Mostre 
que existe x tal que a matriz abaixo é ortogonal: 


a b c 
bx —ax 0 
acx bex —/x 


14.24. Um operador auto-adjunto N: E — E chama-se negativo 
quando (Nv,v) < O para todo v £ O em E. Determine a (única) de- 
composição polar de um operador negativo N. 

14.25. Prove que os elementos da diagonal de uma matriz negativa 
são números negativos. 

“4 | 


14.26. Prove que a matriz abaixo é negativa | 1 Ai 


14.27. Ache a decomposição polar da matriz E E : 


14.28. Sejam a e M(r xr) ec e M(s x s) matrizes ortogonais. 
Prove que a matriz (r+s) x (t+ s) abaixo é ortogonal se, e somente 


se,b = 0: 
a b 
0 c|' 


14.29. Obtenha a decomposição polar da matriz 


v2 1/1 
= 7 1 
O 7=1 


E 


Operadores Normais 
(Caso Real) 


Estudaremos agora o tipo mais geral de operadores (num espaço ve- 
torial de dimensão finita, munido de produto interno) para os quais 
vale um resultado análogo ao do Teorema 14.8, ou seja: existe uma 
base ortonormal na qual a matriz do operador começa na forma di- 
agonal, seguida por uma série de blocos 2 x 2 da forma 


a Bb 
E al 
Eles são os operadores normais. Na Seção 21 veremos que, nos espa- 
ços vetoriais complexos, os operadores normais são precisamente 
aqueles que admitem uma base ortonormal de autovetores. 

Nesta seção, todos os espaços vetoriais têm dimensão finita e são 
munidos de produto interno. 

Um operador linear A: E > E chama-se normal quando comuta 
com seu adjunto, isto é, quando AA* = A*A. 

Uma matriz quadrada a diz-se normal quando comuta com sua 
transposta, isto é, quando aa! = a!a. Portanto um operador é nor- 
mal se, e somente se, sua matriz relativamente a uma base ortonor- 
mal é uma matriz normal. 
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Exemplo 15.1. Os operadores auto-adjuntos e os ortogonais são 
normais. Analogamente, as matrizes simétricas e as ortogonais qua- 
dradas são normais. 

Exemplo 15.2. (Matrizes normais 2 x 2.) Seja à = Ê a uma 
matriz normal 2 x 2. Temos 


agi = a2+c? ab+cd 
“lab+cd bl+d 








Sião: q2+b” ac+bd 
“lac+bd c+d 


Logo a é normal se, e somente se, b? = c? (isto é, b = +c) e ab + 
cd — ac+bd. Seb — c, a matriz a é simétrica. Caso contrário, 
temos c = —b (com b Z 0). Então, de ab + cd = ac + bd resulta 
b(a— d) = b(d — a), donde a = d. Portanto, as únicas matrizes 
normais 2 x 2 são as simétricas e as da forma 


a= [o al 


Observe que sea Z 0 então O £r = Va? +b?. Logo existe 0 € R tal 
que cos0 = a/re sen O = b/r. Então a matriz a se escreve como 


= cos0 -—sen0 
— |[sen0 | cos0 |” 


Isto nos permite concluir que uma matriz normal 2x2 ou é simétrica 
ou é a matriz de uma semelhança no plano. 

Um operador linear A: E — E chama-se anti-simétrico quando 
At = -A, ou seja, (Au,v) = —(u, Av) para u,v € E quaisquer. Para 
que A seja anti-simétrico é necessário e suficiente que sua matriz 
[a;;] em relação a uma base ortornormal de E seja anti-simétrica, isto 
é, aj — —a; para quaisquer 1,j — 1,2,...,n. Em particular, a; — 0. 
Num espaço de dimensão 1, todo operador anti-simétrico é igual a 
zero; logo o único autovalor possível de um operador anti-simétrico 
é O. 

Evidentemente, todo operador anti-simétrico é normal. 
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Teorema 15.1. Seja A: E — E um operador normal. Existe uma 
base ortonormal de E na qual a matriz de A tem a forma 


- | 


o 


Kg 8 


Bs Os 
onde os elementos não expostos são iguais a zero. 


Demonstração: Sejam o RR à os autovalores distintos do 
operador não-negativo AA* = A*A: E > E, com 0, = 0e o; > 0 
sei > 1. Para cadai = 0,1,...,k, seja E = N(AA* — o$1) o auto- 
subespaço correspondente ao autovalor oz. O Teorema Espectral 
nos afirma que E = Bb 0 E, & ---. & Ex. Além disso, seu E Ej e 
ve E; comi jentão (u,v) = O. Da igualdade AA* = A*A re- 
sulta imediatamente que cada subespaço E; é invariante por À e por 
A*. Ora, por definição, AA* em E, coincide com AR Logo o ope- 
rador B;: E; — Ei, definido para i = 1,2,...,k por Biv = (1/o;)Av, 
é ortogonal. Tomemos em E, uma base ortonormal qualquer. (Ob- 
serve que E; — N'(AA*) = N(A) = N'(A*).) Tomemos ainda, em 
cada subespaço E; (i = 1,...,k) uma base ortonormal na qual a ma- 
triz do operador B; tenha a forma dada no Teorema 14.3. Juntando 
todas essas bases e ordenando seus elementos na forma adequada, 
obtemos uma base de E na qual a matriz do operador À é do tipo 
desejado. 


Observações: 
1. Os números A;,...,A, são os autovalores de A. Dentre eles, os 
não-nulos têm a forma A; = +o;, onde o; é um valor singular de A. 


Os demais valores singulares de À são 0; = « [os + Bj = A aaeçõis 
2. Se A não possui autovetores, a matriz do Teorema 15.1 não apre- 
senta a parte superior (diagonal). Por outro lado, se A é auto-adjunto 
não existem os blocos 2 x 2 da parte inferior. 
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Corolário. Seja A: E > E um operador anti-simétrico. Existe uma 
base ortonormal de E relativamente à qual a matriz de A tem a forma 


0 


| &f | 
o | 


| 6] 
Bs O 
Segue-se imediatamente que o posto de um operador anti-simé- 
trico é um número par. 


Exemplo 15.4. Seja A: Ré — Rº um operador anti-simétrico. Pelo 
corolário acima, existe uma base ortonormal (uy, u2,u3) C Rº tal que 
Au = 0, Au = —Bus e Au; = Bu,. Em termos do produto vetorial 
clássico de Rº, podemos escolher o sinal de u; de modo que se tenha 
u X 19 = us eus x uy = u2. Então, se pusermos w = Pu, teremos 
O = Au, = uw x w, Auw = —Bus = B(my x uy) = ww x we Aus = 
Buz = B(uz x u4) = u3 x w. Assim, À coincide com o operador linear 
vi5 vxw nos vetores básicos u, uz, us. Concluímos que, para todo 
ve Rº, vale Av = v x w. Em resumo: todo operador anti-simétrico 
no espaço Rº consiste no produto vetorial por um vetor fixo w € Rº. 


Exercícios 


15.1. Seja À = B+ C a decomposição do operador A como soma do 
operador auto-adjunto B com o operador anti-simétrico C. Prove que 
A é normal se, e somente se, BC — CB. 


15.2. Prove que os operadores auto-adjuntos S, T: E — E são iguais 
se, e somente se, (Sv,v) = (Tv, v) para todo v € E. Use este fato para 
provar que A: E — E é normal se, e somente se, |Av| = |A*v| para 
todo v E E. 


15.3. Se dim E =n e o operador normal A: E —> E temn autovalores 
distintos, prove que À é auto-adjunto. 
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15.4. Sejam uy,...,uUn as linhas e vj,...,vn as colunas de uma ma- 
triz a. Prove que (u;,u;) = (vi, v;) para quaisquer i,j & a é normal. 


15.5. Prove que uma projeção P: E — E é um operador normal se, e 
somente se, P = P*. Resultado análogo para uma involução. 


15.6. Seja A: E — E um operador normal. Prove que NV (A) = N'(A*) 
e conclua que N (A)! = Tm(A) = Tm(A*). 


15.7. Entre as matrizes abaixo, determine quais são normais. 


” 3 =6 1 Za od b 
g=|5 9 &b b=/3 2 2) c-ejb - 2 
6 —6 9 2 a Q =2 =] 


15.8. Sejam A,B: E — E operadores normais. Supondo AB = 0, 
prove: 


(a) A imagem de B está contida no núcleo de A; 
(b ) A imagem de B* está contida no núcleo de A*; 


(c) A imagem de A está contida no núcleo de B. 


Conclua então que BA = 0. 


15.9. Se A,B: E —> E são normaise AB = BA, prove que AB é normal. 


15.10. Dê exemplos de operadores normais À, B tais que À + B não 
é normal e AB não é normal. Dê também um exemplo em que AB é 
normal mas AB £ BA. 


15.11. Seja A: E > E um operador linear no espaço E, de dimensão 
finita, com produto interno. Supondo I+ A e I— À invertíveis, defina 
S=(I4+AJ(I- A). Prove que S é ortogonal se, e somente se, À é 
anti-simétrico. 


15.12. Seja o operador A: Rê — Rº dado por A(x,uy,z) = (y+2z, -x+ 
3z,—2x — 3y). Escreva sua matriz na base canônica e veja que À é 
anti-simétrico. Por escalonamento, ache um vetor u € Rº que é uma 
base de N'(A). Obtenha ainda uma base (v,w) C N'(A)- e escreva a 
matriz de A na base fu, v,w) C Rº. 
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15.13. Seja A: Ré — Rº o operador linear definido por 





Alxyzt)=(yu-z+t;-x—-z+2tx+Hy-t,-—x—2y+2z). 


Mostre que A é anti-simétrico. Ache bases ortonormais 
fu, vi C N(A) efu,v) c N'(A)-+. Determine a matriz de A na base 
fu,v,u!,vjcRº. 


15.14. Se o operador A: E > E é anti-simétrico, prove que todo vetor 
v € E é perpendicular à sua imagem Av. Se E = Rº, prove que A é 
um múltiplo «R da rotação de 90º R:R? > R?. 


15.15. Seja 
0 c —b 
a=|-c O a 
b -—-a O 


a matriz do operador A: Ré — Rº. Mostre que, para todo v E Rº 
tem-se Av=vxw,ondew = (a,b,c). 


15.16. Seja A: E > E um operador normal. Se Au = Au e Av = uv 
com À £ L, prove que (u,v) = 0. 


15.17. Sejam w,..., un os vetores-linha e v,...,Vn OS vetores-coluna 
da matriz o é ,jondea e M(p xp). Selul=Ivilparai=1,...,n, 


prove queb=0€e M(px (n—p)). 


15.18. Se um subespaço F C E é invariante pelo operador normal 
A: E > E, prove que F também é invariante por A* e que o comple- 
mento ortogonal Fl é ainda invariante por A e A*. 


15.19. Seja F c E um subespaço invariante pelo operador normal 
A: E > E. Prove que a restrição de À ao subespaço F é ainda um 
operador normal. 
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Pseudo-inversa 


A noção de pseudo-inversa e o estudo de suas propriedades consti- 
tuem uma maneira simples e atraente de aplicar alguns dos resul- 
tados obtidos nas seções anteriores. Do ponto de vista prático, esta 
noção responde uma pergunta bastante natural, que ocorre de fato 
em diferentes aplicações da Álgebra Linear: dada A E L(E;F) e dado 
be F, se é impossível achar x € E tal que Ax = b, qual é, ou melhor, 
quais são os vetores x € E tais que o erro |Ax — b| é o menor possível 
e qual entre esses vetores x é a solução ótima, ou seja, tem a menor 
norma? 


Sabemos que um sistema de m equações lineares com n incógni- 
tas pode ser interpretado como o problema de achar um vetor x E R" 
tal que Ax = b, onde A:R” — R” é a transformação linear cuja 
matriz (nas bases canônicas de R”" e R?) é dada pelos coeficientes do 
sistema e b E R” é o vetor cujas coordenadas são os números que 
figuram nos segundos membros das equações do sistema. 

Se b não pertence à imagem de A, o sistema Ax = b evidente- 
mente não possui solução. Faz sentido, entretanto, procurar em R” 
um vetor x tal que Ax esteja o mais próximo possível de b e, dentre 
esses vetores x, aquele de menor norma. Isto nos leva à noção de 
pseudo-inversa de uma transformação linear. 

Seja A: E —> F uma transformação linear entre espaços vetoriais 
de dimensão finita, munidos de produto interno. A pseudo-inversa 
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de À é a correspondência A*:F — E que associa a cada y E Fo 
vetor Aty =x € E de menor norma entre todos os vetores x € E que 
tornam mínima a distância ly — Axl. (Fig. 16.1.) 





Figura 16.1. 


Descrevamos como opera a pseudo-inversa A*:F — E. Dado 
y € F,o vetor de Zm(A) mais próximo de y é a projeção ortogonal 
Vo de y sobre Zm(A), caracterizada pelo fato de que yo € Zm(A) 
e y — yo é perpendicular a (todos os vetores de) Zm(A), ou seja, 
y—vo E N(A*). Como y e Zm(A), existem vetores x E E tais 
que Ax = yo. Se x é um deles, os demais são da forma x + z, onde 
z € N(A), pelo Teorema 6.4. Dentre estes vetores x + z, o de me- 
nor norma é x — xo, onde xo é a projeção ortogonal de x sobre N'(A) 
pois sendo x — xo perpendicular a N'(A), Pitágoras nos dá, para todo 


ZE N(A): 


x+z2=|x—-xo+z+xoP =|x— xo? + Iz + xo! > |x — xol>. 


(pois z + xo € N(A), logo é perpendicular a x — xo). Portanto A*y = 
x— xo. Note que, sendo ortogonal a N(A), A*y pertence a Tm(A*). 
Na realidade, A*y é o único vetor da imagem de A* tal que AA ty = 
Vo. (Com efeito, A, restrita a Zm(A*), é injetiva, visto que Zm(A*) N 
N(A) = (0).) 

Esta definição da pseudo-inversa de uma transformação linear 
A: E — F apresenta-a como uma função bem definida A*:F 5 E, 
com as propriedades geométricas procuradas, porém não deixa claro 
se A? é uma transformação linear. Usando o Teorema 13.10, apre- 
sentaremos em seguida uma transformação A': F > E, que certa- 
mente é linear mas que usa certas bases escolhidas em E e F, de 
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modo que não parece estar bem definida. Em seguida, provaremos 
que A' — A”, logo At é linear e A' não depende das escolhas de 
bases. 

Seja r o posto da transformação linear A: E > F. Pelo Teorema 
13.10, existem bases ortonormais (u,...,in) CE, (vy,..sVm CFe 
números positivos 07,...,0, tais que Au; = ojv;, A*v; = c;u; para 
I<i<reAu =0,A*v; = 0 parai>r. Pelo Teorema 4.1, existe 
uma única transformação linear A': F > E tal que 


1 : ; 
Avi=—u;paral<i<r e Av; -0quandoi>r. 
0i 


Teorema 16.1. A' = A* — pseudo-inversa de A. 


Demonstração: Devemos mostrar que, para todo y € F,o vetor A'y 
é igual a Ay, isto é, tem as seguintes propriedades: (1) AA'y = yo 
é o vetor de Zm(A) mais próximo de y; (2) Ay é o vetor de menor 
norma em E cuja imagem por À é yo. Estas afirmações são equiva- 
lentes a (1) (y — AA'y) 1 Tm(A), ou seja, y — AA'y E N(A*), ou 
ainda, A*y = A*AA'y; (2) Ay E Tm(A*). Evidentemente, basta ve- 
rificar a validez de (1º) e (2) quando y é qualquer um dos vetores 
básicos v1,...,vm. Nestes casos, porém, (1') e (2') resultam imedia- 
tamente da definição de A". 














Corolário 1. AAt:F > Fé a projeção ortogonal sobre Im(A) e 
A*A: E > Eéa projeção ortogonal sobre Tm(A*). 

Com efeito, temos AA'v;, = vsel <i<r, Avi =Ogse 
i>r,A'= Atel(v,...,v) C Zm(A) é uma base. Analogamente 
para AtA. (O Corolário 1 também resulta diretamente da definição 
de A?.) 


Corolário 2. Se A: E —» Féinjetiva então At = (A*A)! A+. 














Com efeito, se À é injetiva, o operador A*A: E > E é invertível. 
(Corolário do Teorema 13.9). A igualdade alegada significa que 
A*(AA?) = A*, o que foi estabelecido na prova do Teorema 16.1. 
(Forma final da condição (1').) 


Corolário 3. Se A: E — Fé sobrejetiva então At = A*(AA*) |. 














Com efeito, ainda pelo Corolário do Teorema 13.9, A sobrejetiva 
implica que o operador AA*: F — Fé invertível e a igualdade alegada 
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equivale a (At AJA* — A*. Isto é evidente se substituirmos A* por 
A! (vide prova do Teorema 16.1) e testarmos a igualdade em cada 
um dos vetores da base (vj,...,vm) E F. 














Corolário 4. Se A: E — Fé invertível então At = A”. 











Evidente. 





Segue-se dos Corolários 2 e 3 que se À é injetiva então A* é uma 
inversa à esquerda de A, e se À é sobrejetiva então A” é uma inversa 
à direita de A. 


Corolário 5. Para toda transformação linear A: E — F, tem-se 
(ANT =(AT:ESF. 


Com efeito, as bases ortonormais fornecidas pelo Teorema 13.10 
e usadas na definição de A' tanto servem para À como para A*. Se 
as utilizarmos com A* em vez de À, obteremos (A*)'u; = (1/o;)v; se 
I<i<re(A*)'u =0Osei>r+1. Mas é claro que (A')* opera 
do mesmo modo sobre os vetores básicos u;. Logo (A')* = (A*)' e daí 
segue o corolário. 














Exemplo 16.1. Se A:E > F é ortogonal então é injetiva, logo 
At = (A*A)! A*. Mas a ortogonalidade de A significa A*A = Ik, 
logo At = A+. 


Exemplo 16.2. Seja A: R? — Rº dada por A(x,y) = (x,y,0). Como 
A é ortogonal, temos A" = A*. A matriz de À tem colunas (1,0,0) e 
(0, 1,0), logo estas são as linhas da matriz de A*, portanto A*(x,y,z) 
— (x,y). Portanto a pseudo-inversa de À é At: Rê — Rº, dada por 


A Ee (x,y). 


Exemplo 16.3. Definamos A: Rº? — Rº pondo A(x,y) = (x,y,x + 
y). Como A é injetiva, sua pseudo-inversa é At — (AtA)! A+. As 
colunas da matriz de À (linhas da matriz de A*) são (1,0,1) e (0,1,1), 
logo 

ASIM UE) = (x+z,y 2) 


e daí 
A*Alx,u) = (2x + y,x + 2uy). 


Para determinar (A*A)! (x,y) = (s,t), resolvemos o sistema 
(A*A)(s,t) = (x,y), ou seja 2s+t =x, s+2t = y, no qual as incógnitas 
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são s, t. Encontramos 


go xo) (ya) 


3 3 
Portanto ] 
(AMA ed = 32x —y2y—x). 
Assim, para qualquer (x,uy,z) € Rº temos 


AP Oayse) = MAPA Aba ua) 
=(A*AJ! (x+ay+2) 





1 
= (2x uv+z2y-—-x+2z). 
Exemplo 16.4. Seja B: Rê — R? dada por 


1 
312x—U ei o Re! a O 


Temos as matrizes de posto 2: 


PR a 2 + 
Lo e RS À 2 
=| 2 1 11 


Logo B é sobrejetiva e Bt — B*(BB*) |. Como a matriz de B* é b!, 
temos 


B(x, uz) = 


1 
Bi, y) = (2x —y,—x + 2y,x+U) 
para qualquer (x,y) € R?. Segue-se que BB*: R? — R? é dado por 


BE ul= By, =" + 20, 29) 





(6x — 3y, —3x + 6y) 


(2% = Up =* ZU). 


“s" en = la 


Para determinar (BB*)! (x,y) = (s,t), resolvemos o sistema 
BB*(s,t) = (x,y), isto é, 2s— t = 3x, -s + 2t = 3y, nas incógnitas 
s, t, e encontramos s = 2x +y, t=x + 2y, portanto 


(BB) (x,y) = (2x +y, x + 29). 
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Isto nos dá, finalmente: 


(BB*)! (x,y) 


Bru) =B 
= BZ rua 2Zy) 


* 
* 


(3x, 3y, 3x + 3y), 


1 
3 
ou seja, Bt (x,y) = (4x +V). 

Retomando a transformação A do Exemplo 16.3, vemos que B = A* 
e constatamos que (A!)*! = B' = A. 

A relação A'* = A, verificada no caso particular acima, é verda- 
deira em geral. Isto pode ser visto facilmente examinando a defini- 
ção da transformação A' e notando que (A')' = A. Como A' = A*,o 
resultado segue daí. 


Exercícios 


16.1. Determine a pseudo-inversa de cada uma das seguintes trans- 
formações lineares: 


(a) A transformação nula O: E > F; 
(b) A projeção ortogonal P: E — E sobre o subespaço F; 


(c) A mesma projeção acima, considerada como transformação li- 
near de E sobre F; 


(d) A projeção (não-ortogonal) P: R? — R?, sobre a reta F, parale- 
lamente à reta G. (Descreva P* geometricamente.) 


16.2. Para toda transformação linear A: E > Fetodo « 0, prove 
que (x - A)* = 2 Ar. 


16.3. Identifique o núcleo e a imagem da pseudo-inversa de uma 
transformação linear A: E 5 F. 


16.4. Dada a transformação linear A: E — F, prove que, para todo 
w € F, tem-se A'AA*w = A*w. 
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16.5. Sejam A:E > Fe B:F > G transformações lineares. Se 
Im(A) = Zm(B*), prove que (BA)! — A*B*. 


16.6. Dado o operador A: E > E, prove: 


(a) Se A é auto-adjunto, A! também é. 
(b) Se A é normal, A* também é. 


(c) Se A é não-negativo, A” também é. 


16.7. Dados os vetores linearmente independentes vi,...,vr E R”, 
seja a e M(n x 7) a matriz que os tem como colunas. Prove que a 
projeção ortogonal de um vetor qualquer x E R” sobre o subespaço 
gerado por v1,...,v, é Px = a(a!a)! a! x, onde identificamos o vetor 


x ER” com a matriz xe M(n x 1) cuja única coluna é x. 


16.8. Use a fórmula acima para determinar a projeção ortogonal do 
vetor (1,2,3) sobre o plano gerado pelos vetores (1,1,1) e (1,-1,1). 


16.9. Seja A: R" — R” uma transformação linear. Prove que, dado 
qualquer b E R”, a equação A*Ax = A*b sempre possui solução. 
(Uma infinidade delas se A*A não é invertível.) 


16.10. Prove as seguintes propriedades da pseudo-inversa de uma 
transformação linear À: E 5 F: 


(a) AAtA-=A 

(b) AtAAt=A* 
lo JAMPP=AA” 
(d) (AtA)*=AtA. 


16.11. Seja A: R? — Rº dada por A(x,y) = (x,y,2x+3y). Determine 
a pseudo-inversa At: Rº > Rº. 


16.12. Ache a pseudo-inversa da transformação linear A: Rê > R?, 
sabendo que A(x,y,Z) = (x +u,y + z). 
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16.13. Determine a pseudo-inversa de uma matriz diagonal d = 
[dj] E M(n x n). (Isto significa, naturalmente, a matriz de D*, 
onde D: Rº > R” é o operador linear cuja matriz na base canônica 
é d.) Considere explicitamente o caso em que a diagonal de d é 
(1,0,—2,0,1/3). 


16.14. Dada a transformação linear (não necessariamente injetiva) 
A:E SF sejam P:E > EeQ:F > Fas projeções ortogonais sobre 
Im(A*) e Im(A) respectivamente. Interprete e demonstre a igual- 
dade A* — PAT Q. 


16.15. Defina o operador A: R? — Rº pondo A(x,y) = (x— y,x—y). 
Determine a matriz de At: R? — R? na base canônica. Ache o vetor 
v € Rº de menor norma tal que Av está o mais próximo possível de 
w = (3,5). 


16.16. Dado o vetor não-nulo a € E, defina a transformação linear 
A:R — E pondo À -1 = a. Mostre que A*: E > R é definida por 
At.w = (a,w) e, usando a expressão At — (A*A)! A*, conclua que 
A*:E>R é dada por A*.w = (a,w) /la/>. 


16.17. Fixado o vetor não-nulo b € E, defina B: E > R pondo B-w = 
(b,w). Mostre que B* — B*(BB*)! para concluir que B*:R > E 
cumpre B*.1 =b/|bP. 


16.18. Sejam A:R > Ee B:E > R definidas por A-1=a,B.w= 
(b, w), onde a,b E E são vetores fixados de tal modo que (a,b) < 0. 
Prove que as transformações lineares (BA)*:R > Re A'B*:R 5 R 
são dadas por 


] — 4a,b) 
(a,b) e (A'B').1= jaF-jbP' 





(BA)! -1= 
Conclua que, em geral, se tem (BA)! 2 At'B*. Dê um exemplo con- 
creto desta desigualdade, com A:R > R?eB:R?5R. 


16.19. Com a notação dos dois exercícios anteriores, prove que 
(AB)* = B+A+. 
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16.20. Seja A: E > Fa transformação linear de posto 1 dada por 
Av = (va)b, ondea E Eeb E F são vetores Z O. Sabendo que 
A*w = (w,b) a para todo w € F (cfr. Exercício 11.17), mostre que 


E (w, b) 
>——. "q 
“E apê 
para todo w € F. 


16.21. Sejam A: R” — R” sobrejetiva e B:R” — R” injetiva. Prove 
que (BA)* = A*B*. (Generalização do Exercício 16.19.) 


16.22. Prove que a projeção P: E > E é ortogonal se, e somente se, 
P+=P, 


16.23. Use o Exercício 16.20 para calcular a pseudo-inversa da 
transformação linear A: R? — Rº que tem a matriz 


| 3 
a=|4 12 
IS 


16.24. Sejam v1,v2,V3,V4,V5 € Rº as colunas de uma matriz [aj] € 
M(4 x 5). Suponha que v; e v; sejam L.I. e que vz = bj3vj + basvz, 
va = bygvi + bagva, v5 = bys5vi + ba5v>. Prove que 


am Qi q13 am ais am am 
a 22 23 a as) - l|ax az) (1 0 bjs by bys 
a3 3 as as as)  lazm aa) [0 1 bz by bz 
041 042 43 dum dus aq 42 


Mostre que este é um método geral para exprimir toda matriz m xn 
de posto r como produto de uma matriz m x r por uma matriz r x, 
ambas de posto (máximo) igual a tr. Compare com o Exercício 6.29, 
do qual esta é uma versão matricial. Mostre que as matrizes 4 x 
2e2x 5 acima foram obtidas a partir da solução natural daquele 
exercício. Deduza daí (com auxílio do Exercício 16.21) um processo 
para calcular a pseudo-inversa de qualquer matriz. 
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Tópicos Matriciais 


Salvo o item Ce a observação final do item G, os assuntos tratados 
nesta seção não serão necessários para entender as seguintes. Alguns 
deles são traduções, para a linguagem das matrizes, de teoremas e 
métodos apresentados nas seções precedentes, outros são tópicos ma- 
triciais interessantes em si mesmos ou temas clássicos do cálculo ma- 
tricial que se têm revelado úteis, especialmente sob o ponto de vista 
computacional. 


17.A Matrizes de Gram 


Seja E um espaço vetorial de dimensão finita, munido de produto 


interno. A matriz de Gram dos vetores vy,...,v, € E é a matriz 
g = Ig] e M(k xk), onde gi; = (vi, v;). Quando precisarmos ser mais 
explícitos, escreveremos g = g(vj,..., Vk). 

Dada uma base YU — (uj,...,un) CE, sejaa — [a;le M(n xk) a 


matriz das coordenadas dos vetores v; em relação à base UU, isto é: 
vi = um +-+anjm para j=1,...,k. 


Seja ainda h — [h;] e M(n xn) a matriz de Gram da base 4, isto é, 
h; = (w,u;). Então, para i,j = 1,...,k, temos (escrevendo mi; para 
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indicar o ij-ésimo elemento de uma matriz m): 


n 
Jij — (Vi, Vi) tê oro o) = PE Ari Asi hrs 


T,s=1 


Dias (> - — > (a!)is(ha);; = (a'ha); 
s=1 


r=1 


es 


portanto g = a'ha. 
Em particular, se tomarmos uma base ortonormal (u,...,Un) E 
E, teremos h = L,, portanto a matriz de Gram g se escreve como 


a 
g=g(vi,..5Vk) -=a a, 

onde a é a matriz das coordenadas dos vetores v; em relação a uma 

base ortonormal de E. Daí resultam: 


1) Toda matriz de Gram é não-negativa; 


2) A matriz de Gram g = g(vi,...,Vk) é positiva (isto é, invertível) se, 
e somente se, os vetores v1,...,Vk são L.I.. 

Reciprocamente, se uma matriz g = [g;;] e M(k x k) admite uma 
decomposição do tipo g = a! .a, onde a = la;] e M(n x k) então, 
tomando uma base ortonormal (uy,..., Un) C E e escrevendo 


n 
Vij— > au; (5 =— 1,...,k), 
i=1 
obtemos vetores v1,...,Vk € E tais que 
(Vis Vj) -, Aki dk; = (a! “aj; = = 9» 


logo g = g(vy,...,vk) é a matriz de Gram dos vetores vy,...,vk. Isto 
leva a mais uma propriedade das matrizes de Gram: 


3) Toda matriz não-negativa g = Ig;l e M(k xk) é a matriz de Gram 
de uma lista de vetores vy,.. .,v; E E. 

Com efeito, existe a e M(k x k) simétrica (e não-negativa) tal que 
g=-a”=a!.a (Teorema 13.8). 
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17.B Matrizes Triangulares 


Uma matriz t — [t;] e M(n x n) diz-se triangular superior quando 
ty; =0 parai >j etriangular inferior quando ti; = O para i < j. 

Trataremos primordialmente de matrizes triangulares superio- 
res. As propriedades das triangulares inferiores são análogas e se 
provam analogamente. 

Uma matriz triangular superior é a matriz de um operador linear 
T:R” > R” tal que (e; Te;) — O para i > j. Se chamarmos de F; 
" o subespaço vetorial formado pelos vetores (x1,...,xi,...,0) cujas 
últimas n — i coordenadas são nulas, a matriz do operador T:R” > 
" (na base canônica) é triangular superior se, e somente se, todos 
os subespaços F, C --- C F, são invariantes por T. 

Com efeito, a condição (e;, Te;) = O para i > j significa que, para 
cada j, as últimas n — j coordenadas do vetor Te; são nulas, ou seja, 
que Te; € F; paraj = 1,...,n. Isto é o mesmo que dizer que T(F;) c F; 
para todo j. 

Seguem-se algumas propriedades das matrizes triangulares su- 
periores: 














1) O produto de duas matrizes triangulares superiores é ainda uma 
matriz triangular superior. 

Com efeito, se o subespaço F; C R” é invariante por cada um dos 
operadores S, T: R” > R” então F; é invariante pelo produto ST. 


2) Uma matriz triangular superior t = [tj] é invertível se, e somente 
se, os elementos ti da sua diagonal são todos diferentes de zero. No 
caso afirmativo, a inversa t”! é triangular superior e os elementos de 
sua diagonal são Ler 

Com efeito, se todos os ti; são £ 0, dado um vetor não-nulo v E R” 
provemos que Tv < O (onde T é o operador de R” cuja matriz na base 
canônica é t). Seja v = xje1+---+x,er, com x, £ O. Como (e,., Te;) = O 
para i< r, temos 


(er, Tv) = a (er,xiTei) — xr (er; Ter) — Xrtrr, 
i<r 


portanto (e;, Tv) £Z0,e daí Tv Z 0. Assim t é invertível. 
Reciprocamente, se t (ou seja, T) é invertível então, para cada 
i=1,...,n,a restrição T: F > F;, de T ao subespaço F;, é também 
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invertível, logo sobrejetiva. Se fosse ti; = (e; Te;) = 0, teríamos, 
como acabamos de ver, para todo v = xje; + --- + x,e; € F;, (e; Tv) = 
xiti = 0, logo Tv € F;.4. Isto significa que T(F;) C F;. 4, contradizendo 
a sobrejetividade de T: F; > F;. Portanto todos os ti; são diferentes 
de zero. 

Se a matriz triangular superior t é invertível, o operador linear 
T:R”" > R" também é. Cada um dos subespaços F; = S(ey,...,e;) € 
R” sendo invariante por T é também invariante por T”!. (Com efeito, 
A(P) CF > A(F) = F > AF) = F) Logo a matriz t!, do 
operador T”!, é também triangular superior. Escrevendo t”! = sig), 
a igualdade t!t = L, nos dá, para cadai = 1,...,n: 


Tn 
t=firtas so Sh = Sutio 
k=] 


poissk=0Osei>kety=-0Osek>i. Logo s; = 1/tj. 


3) Os autovalores de uma matriz triangular superior t — [tj] € 
M(mn x n) são os elementos t;; da sua diagonal. 


Por definição, os autovalores de t são aqueles do operador 
T:R”" > R? cuja matriz na base canônica é t. 

Em primeiro lugar, se À é um autovalor de t, isto é, se existe 
n+0emR"talque Iv=A-v,sejav=x;e +--- + x,er, com x, £ 0. 
Então, como (e,, Te;) = O sei < r, temos 


At = lesAvi= (e, Iv) 
= (e,xiley+---+x Te) 
= (en Ter) = trXr. 


Segue-se que À = ty. Assim, somente os números t; podem ser 
autovalores de T. 

Em segundo lugar, todos os t;; são, de fato, autovalores de t. Com 
efeito, a matriz t — til, é triangular superior e o i-ésimo elemento 
de sua diagonal é zero, logo não é invertível. Consequentemente, t;; 
é um autovalor de t. 


4) Seja U = (m,...,un) C E uma base ortonormal, obtida pelo pro- 
cesso de Gram-Schmidt a partir da base V = (vy,.. vn) CE A 
matriz de passagem de V para U é triangular superior e seus autova- 
lores são todos positivos. 
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Com efeito, escrevendo 


n 
U; = ba PV 
i= 


sabemos que cada u; pertence ao subespaço vetorial gerado por 
V1,---+Vj, logo u; = Pijvi + --- + Pjjv;. Isto mostra que a matriz de 
passagem p = [p;l e M(n x) é triangular superior. Além disso, 
como u; = yr! w;, onde o vetor w; tem a forma 


W — Vi; = ) KijVi, 


i<j 


vemos que pj — by! é positivo, para cada j = 1,...,n1. Como vimos 
acima, esses números pj; são os autovalores da matriz p. 


17.C Decomposição de Cholesky 


Mostraremos que toda matriz positiva a — [a;] e M(n xn) pode ser 
expressa como o produto a = t! .t, onde t e M(n x n) é uma matriz 
triangular superior cujos elementos da diagonal são todos positivos. 
A expressão a = t! . t chama-se a decomposição de Cholesky da ma- 
triz a. 

Mais adiante (17.G) daremos outra prova da existência da de- 
composição de Cholesky, por um método que permite obter a matriz 
t por escalonamento a partir de a. 

Agora, demonstraremos a possibilidade da decomposição a = t!-t 
usando Gram-Schmidt e a existência da raiz quadrada de a quando 
a > 0 (isto é, quando a é positiva). 

Como vimos acima (17.4) existem vetores vi,...,Vn E R” tais 
que a; — (vi,V;), ou seja, a — g(vi,...,Vn) é a matriz de Gram dos 
vetores vj,...,Vn, OS quais formam uma base de R”, pois a > 0. 

Pelo processo de Gram-Schmidt, obtemos uma base ortonormal 
(tui,...,Un) CR" a partir de vy,...,vn. Parai,j = 1,...,n, temos 


Ui = ) Privro Ui = ) PsjVs» 
r s 


onde a matriz de passagem p=[p;;] é triangular superior, com pi; >0 
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para todo i. (17.B.) Usando o símbolo de Kronecker 6;;, temos 


n n 
Oi; = (Ui, Uj) = >. PrPs; (Va) = >. PrOrsPs;» 


T,s=1 t,8=1 


logo p'ap = L,. Pondot =p !,obtemosa =t! .t. 

A decomposição de Cholesky é única. Noutras palavras, ses et 
são matrizes triangulares superiores n x nn com diagonais positivas 
esl.s-t! .tentãos=t. 

Com efeito, de s!.s = t!.t resulta st”! = (s!)!.tT. Como o pri- 
meiro membro desta última igualdade é uma matriz triangular su- 
perior e o segundo é triangular inferior, concluímos que d = st”! — 
(s!)-1.t! é uma matriz diagonal, com dy > O (e dj = O sei £ j). 
Segue-se imediatamente das igualdades acima ques = dtet = ds. 
Olhando para os elementos da diagonal, temos s; = duti e tá = 
dis. Como s; > 0 et; > 0, isto implica d; = 1,logod =L,es=t. 


17.D A Decomposição qr 


Esta é uma interpretação matricial do processo de Gram-Schmidt. 
Segundo ela, toda matriz invertível a = la;] e M(n xn) admite uma 
decomposição do tipo a = qr, onde q é ortogonal e r é triangular 
superior, com elementos positivos na diagonal. 

Para chegar a este resultado, chamemos de v;,..., vn as colunas 
da matriz ae de YU = (u,,...,un) CR” a base ortonormal obtida dos 
v; pelo processo de Gram-Schmidt. Como sabemos, a matriz p = [pi 
de passagem da base V = (vj,...,vn) para a base 4 é triangular su- 
perior, com elementos positivos na diagonal. Além disso, a matriz 
q = [qi], cujas colunas são os vetores u; = (q1;, Q2;,-..» Qni), é orto- 
gonal. 

Tomando a i-ésima coordenada de ambos os membros da igual- 
dade vetorial u; = > pv, obtemos 

k 


n n 
=> Pour —)> axpy = (ap), 
k=1 k=1 
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para quaisquer i,j = 1,...,n.. Logo q = ap. Amatrizr = p ! é, como 


vimos acima, (17.B), triangular superior com elementos positivos na 
diagonal. De ap = q resulta imediatamente a = qr. 


Observação Dada a matriz invertível a e M(n x nn), são únicas as 
matrizes q, E tais que a = qr, q é ortogonal, r é triangular superior 
e os elementos de sua diagonal são positivos. Com efeito, a = qr 
escreve-se também como ap = q, onde p = r |. Isto quer dizer que p 
é a matriz de passagem da base V = (vi,...,Vn) C R”, formada pelas 
colunas de a, para a base ortonormal U = (u,,...,un) €C R”, dada 
pelas colunas de q. Ora, as quatro condições seguintes implicam 
que cada u; é determinado univocamente a partir de vs,...,V;: 


Duw=povi+Hpyvr + +pyv 
2) u; é ortogonal a vj,...,Vj-1; 
3) lyl=1; 

4) pj > 0. 


Com efeito, 1) diz que u; pertence ao subespaço F € R” gerado por 
V1,::-,Vj. 2) diz que u; pertence a reta R, complemento ortogonal de 
(vi, ..., Vj-1) no subespaço F. Já 3) restringe u; a ser um dos 2 vetores 
unitários da reta R. E, finalmente, 4) diz que u; é o vetor unitário de 
R tal que (u;,v;) é positivo. 

A condição 1) diz que a matriz p é triangular superior. 2) e 3) di- 
zem que a matriz q é ortogonal, enquanto 4) afirma que os elementos 
da diagonal de p são positivos. Juntas, elas garantem a unicidade 
de q e portanto a unicidade de p = a !q. 

A observação acima estabelece também a unicidade do processo 
de Gram-Schmidt sob a condição de que cada u; pertença ao sub- 
espaço gerado por v1,...,v; e cumpra (u;,v;) > O (além, natural- 
mente, de serem u1,...,u; ortonormais). 

Em resumo: a igualdade a = qr significa que as colunas de q 
formam a base ortonormal de R” obtida das colunas de a por Gram- 
Schmidt e r é a matriz de passagem das colunas de q para as colunas 
de a. 
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17.E Diagonalização, Decomposição Polar e Valores 
Singulares 


O Corolário do Teorema 12.2 e o Teorema Espectral 13.6, quando for- 
mulados em termos de matrizes, apresentam as seguintes versões: 


1) Se a matriz quadrada a e M(n x n) possui n autovalores di- 
ferentes então existe uma matriz invertível p e M(n x n) tal que 
pap = d é uma matriz diagonal. Os elementos da diagonal de d 
são os autovalores de a. 


2) Sea matriz a e M(n x n) é simétrica então existe uma matriz 
ortogonal q e M(n xn) tal que q' aq = dé uma matriz diagonal. Os 
elementos da diagonal de d são os autovalores de a. 


Já o Teorema 14.4 assume a seguinte forma: 


3) Toda matriz quadrada a E M(n xn) se exprime como produto a = 
pu, onde p ce M(n x n) é uma matriz não-negativa e u é ortogonal. 


Finalmente, o Teorema 13.10 tem a versão matricial abaixo: 


4) Para toda matriz a E M(m x n) existem matrizes ortogonais p € 
M(mxm), qe M(nxn), tais que paq = d onded e M(mxn) éuma 
matriz diagonal, d — [di], isto é, dy = O sei j. Parai=1,...;r= 
posto de a, tem-se di = 0, >0, E é um autovalor de a!a (e de aa!) e, 
parai>r, dj =0. 


Equivalentemente, podemos escrever a = p!' dq! ou, mudando 
de notação, a = pdq. Esta se chama a decomposição de a a valores 
singulares (singular value decomposition), pois os elementos não- 
nulos o; da diagonal de d são os valores singulares de a, ou seja, 
o; > 0 paratodoi=1,...,n e, além disso, 


Picoto gi 


são autovalores de a!a. 
Seae M(4x 5) e tem posto 3 então a matriz d tem a seguinte 
forma, com À, >0,A2>0eA3>0: 


mM 0 000 
alomooa 
0 02300 
A a 
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17.F A Decomposição lu 


Cada uma das três operações elementares sobre as linhas de uma 
matriz, introduzidas na Seção 9, pode ser interpretada como a mul- 
tiplicação à esquerda por uma matriz invertível de tipo especial, cha- 
mada uma matriz elementar. 


Mais precisamente, uma matriz elementar m x m é uma matriz 
que resulta da aplicação de uma operação elementar à matriz iden- 
tidade In. Há portanto 3 tipos de matrizes elementares. Vejamos 
alguns exemplos no caso 4 x 4: 


0010 1 do db 1000 
0100 oe pod À O «a 0 0 
1 O O Dj * ed Tod) * O 0 10 
vo ol a 00] 00 01 


As matrizes acima se obtêm a partir de L, mediante as operações 
L & Ls, Ly + al; e «Lp respectivamente. 


Afirmamos que aplicar uma operação elementar a uma matriz 
com m linhas é o mesmo que multiplicá-la à esquerda pela matriz 
que resulta de aplicar a mesma operação às linhas de In. 


Isto decorre da seguinte observação (cuja verificação deixamos 
a cargo do leitor): se a » a” simboliza uma determinada operação 
elementar sobre matrizes com m linhas então, para toda b e M(m x 
m), tem-se (ba)' = b'- a. Admitido este fato, tomamos m = [Le 
vemos que, para toda matriz a com m linhas, vale 


a =(Ina)=L,a=ma. 


Portanto o método de eliminação de Gauss para reduzir uma ma- 
triz de m linhas à forma escalonada consiste em multiplicá-la suces- 
sivamente à esquerda por matrizes elementares do tipo 1 (transposi- 
ção de duas linhas) ou do tipo 2 (subtrair de uma linha um múltiplo 
de outra linha). Uma matriz elementar do tipo 2, que corresponda à 
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operação L; — «L;, com j < i, tem a forma abaixo: 


1 


—x ... 1 


1 


Os elementos não indicados fora da diagonal são nulos. O número 
—a está na linha i e na coluna j. A fim de tornar igual a zero o 
elemento ai; da matriz a = [a;;] mediante essa pré-multiplicação, 
deve-se tomar « = a;;/a;j. O elemento a;, que se supõe £ 0, cnama- 
se o pivô. Para eliminar (tornar iguais a zero) todos os elementos 
abaixo da diagonal na coluna j da matriz a, deve-se pré-multiplicá-la 
pelo produto das m—j matrizes da forma acima que se obtêm fazendo 
sucessivamente i = j + 1,...,m. Isto equivale a pré-multiplicar pela 
matriz 


PE 
m; — — 41, (+) 


(com os os na j-ésima coluna), onde x; = a;;/a;j. Por exemplo, se 
m=4ej=1, vemos facilmente que 


| 00 O 1 DO T dd 
= 1 00 0 100 o RS 
O 0170] |-q 010 O 010 
0 001 0 001 —-oaq 001 
1 000 
ER 
“ |=04, 010 
ESA, 
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Suponhamos que, durante o processo de escalonamento de uma 
dada matriz, nunca haja necessidade de se efetuar transposição de 
linhas. Então podemos assegurar que existem matrizes m;,...,Mmm 
do tipo (*) acima, tais que 


m...mm;a=u, 


onde u é uma matriz escalonada. Se a for uma matriz quadrada, 
u é triangular superior. (Daí a notação: u provém de upper trian- 
gular, em inglês.) Seu = [u;] e M(m x n) (além de não requerer 
transposições de linha em seu escalonamento) tem posto máximo (m 
ou n) então o primeiro elemento não-nulo de sua i-ésima linha é ui. 
Portanto, neste caso, os elementos u;; da diagonal de u são os pivôs, 
logo são diferentes de zero. 

Evidentemente, toda matriz elementar é invertível, logo toda 
matriz m; do tipo (*) acima possui uma inversa e é claro que 


Kmj 1 


Segue-se então que toda matriz a cujo escalonamento não requer 
transposições de linhas se escreve como 


1 1 1 


a-m m ...m, u-lu 
onde as m; têm a forma (*) eu é escalonada. 

Agora ocorre um fato notável. Embora o produto mm ...mpmy; 
não tenha nenhuma expressão especial, vale a igualdade 


1 
X21 1 


—lmo—l —1 
I-m m, io X32 


Es A&m2 Amm—l | 
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onde q; — aj Rua Nesta notação, indicamos com a) =m;...my a 
matriz que se obtém depois da eliminação dos elementos abaixo da 
diagonal na j-ésima coluna. (Portantoj = 0,1,...,m-—1,eal = a.) 


Estamos admitindo que não houve necessidade de efetuar trans- 
posição de linhas, ou seja, que em todas as etapas se tem o pivô 
(a); 0. 
Concluímos então que, mediante essa hipótese, a matriz a se es- 
creve como um produto 
a=lu, 


ondele M(m x m) é uma matriz triangular inferior (lower triangu- 
lar) com elementos diagonais todos iguais a 1e u é uma matriz esca- 
lonada. Se a for uma matriz quadrada mx mentãou e M(m x m) 
será uma matriz triangular superior. Esta é a chamada decom- 
posição lu da matriz a. 

É importante observar os seguintes fatos a respeito da decompo- 
sição a = lu. 
1º ) O método gaussiano de eliminação fornece diretamente os ele- 
mentos das matrizes leu. 


2º ) Quando se dispõe da decomposição a = lu, a solução do sistema 
ax = b, comb e M(m x 1), se reduz a resolver o sistema ly = b 
e, depois de obtida y, o sistema ux = y. O primeiro se resolve de 
cima para baixo e o segundo de baixo para cima, pois 1 é triangular 
inferior e u é escalonada. 


3º ) A maior vantagem computacional da decomposição a—lu ocorre 
quando se tem de resolver um grande número de equações ax = Db, 
com a mesma matriz a e muitos vetores b. Dispondo da decom- 
posição a = lu não é preciso repetir muitas vezes o processo de 
eliminação gaussiana. 


4º ) A priori, não se sabe quais são (nem mesmo se vão ser ne- 
cessárias) as transposições de linhas durante o processo de escalona- 
mento de uma matriz a. Entretanto, depois de efetuado o processo, 
dispomos da relação de todas as transposições feitas. Efetuando, na 
mesma ordem em que foram feitas, todas essas transposições nas li- 
nhas da matriz identidade, obtemos uma matriz p e M(m x m), que 
se chama uma matriz de permutação. O produto pa corresponde a 
efetuar sobre a matriz a, antecipadamente, todas as transposições 
de linhas que seriam necessárias durante o escalonamento. Por- 
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tanto a matriz pa pode ser escalonada usando apenas operações ele- 
mentares do tipo L; — al;. Assim, tem-se a decomposição pa = lu. 


5º ) Uma condição suficiente (mas não necessária) para que uma 
matriz a € M(m x n) possa ser escalonada sem transposições de li- 
nhas, portanto admita uma decomposição A = lu, é que suas subma- 
trizes principais sejam invertíveis. (Para todo número natural 
r < min(m,n), a submatriz principal de ordem r da matriz a — [aj 
é a matriz a, € M(r x 7) formada pelos elementos a; com | <i<re 
13) 

Provemos este fato no caso de uma matriz a E M(3 x 4). O argu- 
mento no caso geral é o mesmo mas a notação se torna mais compli- 
cada e pode obscurecer a idéia, que é extremamente simples. Seja 


1 dim diz dig 
a — |d2]7 Qd d23 do 
Q31 Q32 33 34 


Como a matriz principal [aj] é invertível, temos a £ 0. Usando 
11 como pivô, efetuamos as operações elementares 


021 031 
L = L, e Ls = L 
011 011 


sobre a matriz a, obtendo a nova matriz 


01 Q12 Q13 dig 


al=|0 bo by by 
O bz bz by 
A matriz 
1 iz 
O bz 


resulta da matriz principal 


sure o Ea 
a21 2 
pela aplicação da operação elementar L; — (az,/ay)Ly, logo é in- 


vertível. Como é triangular, isto obriga b22 Z O. Assim podemos 
tomar bz; como pivô. (Na notação geral, seria a em vez de bz2.) 
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Aplicando a operação L; — (b32/b>2)L; à matriz a!) chegamos à ma- 
triz escalonada 


Q1 Qi Q13 drag 
a) -u=|0 by by by 
O O cs ca 


O mesmo raciocínio se aplica em geral. 


Exemplo 17.1. Considerando o escalonamento 
2 gs 4 12 3 4 , 
oe? E ES | 5 =p) SS 
o Jo 12. 42) E jo =8 =15 =D 
12 3 4 
RE dr e mr o 


pe dd À 0 


obtemos a decomposição 


12 3 4 100 | 2 3 4 
5 6 7 8]=[510 O —4 8 12), 
9 10 12 12 2 a» ] 0 0 1 0 


que exprime a matriz do primeiro membro como um produto do tipo 
lu, de uma matriz triangular inferior com diagonal (1,1,1) por uma 
matriz escalonada com pivôs 1, —4,1. (Todos < O pois a matriz dada 
tem posto máximo.) 


Exemplo 17.2. Examinando, no Exemplo 9.4, as operações ele- 
mentares efetuadas a partir da segunda, quando não ocorrem mais 
transposições de linhas, obtemos a seguinte decomposição do tipo 
a=lu: 


2130 LOGO (is 
0123) |0o100||01 2 3 
3420) l|l53510|/00-B-b 
4201 205$1Wl00 0 7 
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17.G Matrizes Positivas: Cholesky versus lu 


Quando a matriz a = la;] e M(m x m) é positiva, afirmamos que 
todas as submatrizes principais a, = [aj], 1 < i,j < r, são também 
positivas, portanto invertíveis. Com efeito, dado o vetor não-nulo 


v=(x...,x), tomamosV = (X,...,Xm),comx; =x; parai=1,...,r 
exi=Oparai=r+41,...,m. Então v é um vetor não-nulo em R”, 
logo 


r m 
UjXiX = ) UijXiX; > 0. 
1 


Lj= Lj] 


Portanto o processo de escalonamento, quando aplicado a uma ma- 
triz positiva a, não requer transposições de linhas. Assim, tem-se a 
decomposição a = lu. 

Vemos que toda matriz positiva possui duas decomposições: Cho- 
lesky e lu. É natural indagar qual a relação entre elas. Mostraremos 
que são muito próximas: qualquer delas se obtém a partir da outra 
de modo simples. Antes porém precisamos estabelecer a unicidade 
abaixo. 

Se a matriz a é invertível então existe uma única maneira de 
escrevê-la como um produto a = lu, onde 1 é triangular inferior, com 
os elementos da diagonal todos iguais a 1, eu é triangular superior. 

Com efeito, sendo a invertível, a igualdade a = lu obrigaleu a 
serem invertíveis. Portanto 








a=lu,=bu> LH, = uu, ' E 


Ora, o primeiro membro da última igualdade é uma matriz triangu- 
lar inferior e o segundo membro é triangular superior. Logo ambas 
são matrizes diagonais. Como os elementos diagonais de 1 são todos 
iguais a 1, segue-se que 1, = 1 = L,, portanto uy = uy e fica provada 
a unicidade da decomposição a = lu no caso de a ser invertível. 
Voltemos à matriz positiva a e M(m x m), que admite as decom- 
posições a = t!.t = lu, onde 1 é triangular inferior com 1's na dia- 
gonal, te u são triangulares superiores e todos os elementos da dia- 
gonal de t são positivos. Se indicarmos com d e M(m x m) a matriz 
diagonal com di; = t;, então a = (t'd”!)(dt), onde t'd”! é triangu- 
lar inferior com 1º's na diagonal e dt é triangular superior. Segue-se 
da unicidade acima provada quel = t'd”! eu = dt, mostrando as- 
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sim como obter a decomposição a = lu a partir da decomposição de 
Cholesky a = t!.t. 

À expressão u = dt mostra, em particular que se a matriz a é 
positiva então, em sua decomposição a = lu, os elementos ui; da 
diagonal de u (isto é, os pivôs da eliminação gaussiana) são todos 
positivos. A unicidade da decomposição lu implica que esses pivôs 
são univocamente determinados a partir da matriz a. 

Mostremos agora como se pode obter a decomposição de Cholesky 
de uma matriz positiva a partir de sua decomposição a = lu. 

Como ui; > O para i = 1,...,m, podemos formar uma matriz 
diagonal d = [d;;] pondo dj; = O sei £j e di — ui. Então escreve- 
mos t = d”lu. Evidentemente, a = (Id)(d”!u). Portanto teremos a 
decomposição de Cholesky a — t!.t desde que provemos que t! — ld, 
ou seja, queu'.d! = Id. 

Ora, se tomarmos a transposta de ambos os membros da igual- 
dade a = lu obteremos a = a! = u!l, logo podemos escrever 
a=uld2d2 1. Masu'.d” é triangular inferior com 1's na diago- 
nal. (Na realidade, d foi definida com esse propósito.) E d2l" é tri- 
angular superior. Pela unicidade da decomposição a = boldlu, vem 


ud? =I(ed?1' = u). Daí resulta u!.d”! = Id, como queríamos 
provar. 

Em suma: sea = lu é a decomposição de uma matriz posi- 
tiva, sua decomposição de Cholesky é a = (Id)(d”!'u), onde d é a 


matriz diagonal formada pelas raízes quadradas dos elementos (ne- 
cesssariamente positivos) da diagonal de u. Isto nos dá um método 
prático para obter a decomposição de Cholesky, como veremos no 
Exemplo 17.8. 


Observação O argumento acima prova, na realidade, que se a é 
uma matriz simétrica cujos pivôs são todos positivos então existe 
uma decomposição a — t!.t, logo a é uma matriz positiva. (Observe 
que, os pivôs sendo positivos, a matriz a é invertível.) 


Exemplo 17.3. Como exemplo de matriz positiva, tomemos a matriz 
de Gram dos vetores u = (1,2,1), v = (2,1,2), w = (1,1,2). Escalo- 
nando-se, obtemos 


EG ua (o Da 
gr CM ls 2 Sé gd a 


5 7 6] s-8 |0 2 11/6 0 0 1/2 


220 Tópicos Matriciais Seção 17 


Isto nos fornece a decomposição lu: 


é 65 100] [6 6 5 
Epp 1140) 3 2 
576 2 5 1 |0 0 1/2 


Para obter a decomposição de Cholesky, tomamos a matriz diagonal 
6 0 o 
d=|0 v3 0 
e calculamos 


mao | 


I 
AREE 
NS O O 


sh &e 


Então a decomposição de Cholesky da matriz dada é 


EE E 0 q DRE 
A 
7 


V6 v3.0 O v3 2/43] . 


5 6 5//6 2/V3 2/2 o 0 v2/2 


Exercícios 

17.1. Prove que os vetores v;,...,Vvk € E geram um subespaço veto- 
rial de dimensão r se, e somente se, a matriz de Gram g(vy,...,Vk) 
tem posto 7. 

17.2. Se dim E < dim FF, prove que existe uma transformação linear 
ortogonal A: E —> Ftal que Av; = w1,..., Avk = Wk se, e somente se, 
as matrizes de Gram g(v,,...,v.) e g(ws,...,wx) são iguais. 


17.3. Sejam a e M(n x n) uma matriz positiva e b e M(n x 
m) uma matriz de posto n. Ache vetores v;,...,Vm E R” tais que 
g(vi,...,vm) =b'ab. 


17.4. Prove que a!a é a matriz de Gram dos vetores-coluna de a. 


Seção 17 Tópicos Matriciais 221 


17.5. Um operador T: E > E chama-se triangularizável quando o 
espaço vetorial E possui uma base, relativamente à qual a matriz de 
T é triangular. Prove: 


(a) T é triangularizável se, e somente se, existe uma cadeia ascen- 
dente (0)=F; cf c---cF = E, de subespaços invariantes 
por T, com dim F=i (1=0,...,n). 


(b) T é triangularizável se, e somente se, existe uma cadeia descen- 
dente E = Gn D --- > G1 D Go = (0) de subespaços invariantes 
por T tais que dim G;=iparai=0,1,...,n. 


(c) Se existe uma base de E na qual a matriz de T é triangular 
superior, existe também uma base de E na qual a matriz de T 
é triangular inferior. 


(d) T é triangularizável se, e somente se, T* é triangularizável. 


17.6. Seja t = [t;] e M(n x n) uma matriz triangular. Prove que os 
elementos t;; da diagonal de t são autovalores do operador T: R” — 
R” cuja matriz na base canônica é t. Conclua que t é diagonalizável 
quando sua diagonal não possuir elementos repetidos. 


17.7. Seja A:Rº* — Rº o operador definido por A(x,y,z) = (x + 
2y +3z,y +2z,3z). Obtenha dois autovetores L.I. para À e prove que 
qualquer outro autovetor de A é múltiplo de um desses dois. Conclua 
que A não é diagonalizável, embora sua matriz seja triangular. 


17.8. Considere o operador B: RÉ — Rº, dado por B(x,y,z) = (x + 
2z,y-+3z,4z), cuja matriz é triangular. Ache uma base de Rº formada 
por autovetores de B. 


17.9. Dada a matriz positiva 
= 1 2 
“Es 


determine 


de modo que se tenha a decomposição de Cholesky a = t!.t. 
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17.10. Use o método do exercício anterior, de modo a obter a decom- 
posição de Cholesky da matriz positiva 


3 4 6 
a= |4 6 9 
6 9 14 


17.11. Aplicando o processo de Gram-Schmidt às colunas da matriz 


t 2 2 
a=|3 3 4], 
4 13 


obtenha a decomposição a = qr, onde q é ortogonal e r é triangular 
superior, com elementos positivos na diagonal. 


17.12. Mostre como obter, a partir dos teoremas demonstrados nas 
seções anteriores, cada uma das matrizes cuja existência é assegu- 
rada nos ítens 1), 2), 3) e 4) de 17.E (Por exemplo, no item 1), se 
A:R" > R” é o operador cuja matriz na base canônica € CR" é a 
então p é a matriz cujas colunas são os vetores de uma base orto- 
normal U = (uy,...,un; C R”, formada por autovetores de A edéa 
matriz diagonal formada pelos autovalores correspondentes.) 


= 11 
“Ie 
obtenha sua decomposição a = pdq a valores singulares. 


17.14. Assinale V(erdadeiro) ou F(also) 


17.13. Dada a matriz 


( ) Toda matriz quadrada escalonada é triangular superior. 
( ) Toda matriz (quadrada) triangular superior é escalonada. 


( ) As duas afirmações anteriores são verdadeiras quando se trata 
de matrizes invertíveis. 


( ) Se a matriz a admite uma decomposição do tipo a = lu então 
todas as submatrizes principais de a são invertíveis. 
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17.15. Prove que a matriz 


E 


admite uma decomposição do tipo a = lu se, e somente se, b = 0. 


17.16. Obtenha a decomposição lu das matrizes 


122 2 17 0 4 
a=|I3 3 4 e b=|4 5 1 7 
4 13 2 -8 —1 12 


17.17. Seja a e M(m x n) uma matriz de posto máximo que admite 
uma decomposição do tipo a = lu”, ondel e M(m x m) é triangular 
inferior, com elementos da diagonal todos iguais a 1,eu' e M(mxn) 
é escalonada. Prove que existem uma matriz diagonal invertível 
de M(m x m) e uma matriz escalonada u E M(m x n), com pivôs 
todos igual a 1, tais que a = Idu. 


17.18. Obtenha a decomposição lu da matriz do Exemplo 9.8. 


17.19. A partir da decomposição lu, obtenha a decomposição de 
Cholesky das matrizes positivas a = matriz de Gram dos vetores 
u=(1,2,1),v=(1,1,2),w = (2,1,3) e b = produto da matriz 


1 
m = e 
1 
2 


QN + 


1 1 
1 1 
2 2 
2 1 


por sua transposta. 


17.20. Foi visto no texto que se a = lu é a decomposição da matriz 
positiva a e d é a matriz diagonal formada pelas raízes quadradas 
di — Wi dos pivôs então a — (Id) - (d”!u) é a decomposição de 
Cholesky de a. Modifique ligeiramente este argumento para provar 
que existe uma decomposição de Cholesky a = t!.t para qualquer 
matriz não-negativa a. (Mas agora não há unicidade.) 
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Formas Quadráticas 


Uma forma quadrática num espaço vetorial E é uma função que, em 
termos das coordenadas de um vetor relativamente a uma base de E, 
se exprime como um polinômio homogêneo do segundo grau. As for- 
mas quadráticas ocorrem com grande destaque em problemas de oti- 
mização (máximos e mínimos), no estudo das superfícies quádricas, 
na Geometria Diferencial, na Mecânica, etc. Em todas essas situa- 
ções, é relevante o conhecimento do sinal (positivo ou negativo) que 
a forma pode assumir ou, mais precisamente, dos seus autovalores. 
Nesta seção, é feito um estudo conciso, porém abrangente, dos princi- 
pais pontos básicos referentes a essas funções e de suas relações com 
os operadores lineares, finalizando com o método de Lagrange para 
diagonalização e a classificação das superfícies quádricas. 





Sejam E, F espaços vetoriais. Uma forma bilinear b: Ex F > 
é uma função b(u, v), linear em cada uma das duas variáveis u € E, 
v € F. Mais precisamente, para quaisquer u,u EE, v,vV EFea E 
devem valer: 











btu + u,v) = b(u,v) + b(w,v); b(ou,v) = ab(u,v) 
bluvr+v)=b(u,v)+b(u,v); b(u, «v) = ab(u,v). 
As operações evidentes de soma e produto por um número fazem 


do conjunto G(E x F) das formas bilineares b: E x F > R um espaço 
vetorial. 
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Tomando bases 4 = (m,.. sum) CEeV =(v,..sv) EC F,os 
números bi; — b(u;,v;) definem uma matriz b = [b;] e M(m x mn), 
chamada a matriz da forma bilinear b relativamente às bases U, V. 

Conhecidos os valores bi; — b(ui;,v;), os quais podem ser tomados 
arbitrariamente, a forma bilinear b: E x F — R fica inteiramente 
determinada pois, para u — Exu; € Ee v — Ly;v; € F quaisquer, 
tem-se 





b(u,v) = E Ri; b(u;,v;) = > byay; I<xi<m,I<j<n. 
ij 


ij 


À correspondência que associa a cada forma bilinear b: Ex F >» R 
sua matriz b — [bi;;] relativamente às bases 4 c E, V € F (supos- 
tas fixadas) é um isomorfismo entre os espaços vetoriais B(E x F) e 
M(m x n). Segue-se que B(E x F) tem dimensão mn. 

Dadas novas bases U' = (y,.. sun) CEeV =(M,..sv)cF 
sejam 


m n 
(4 / 
“us — > Pjliy Vj = ) qyVi 
i=] i=1 


eb; = b(uí, vj ). A matriz da forma bilinear b relativamente às bases 
U'eV'éhb' = [bi] e M(m x n). O teorema abaixo exprime b' em 
função de b e das matrizes de passagem p = [p;l e M(m x m), 
q= [qi] eM(nxmn). 


Teorema 18.1. As matrizes b e b', da forma bilinear b nas bases 
U, Vel, V' respectivamente, se relacionam pela igualdade b' = 
p'bq, onde p é a matriz de passagem de U para U' e qé a matriz de 
passagem de V para V”. 


Demonstração: Para todoi = 1,...,,jmetodoj = 1,...,n, temos 


m n 
bj = b(u;, vi) = b [> Prillr, D. a) = D. Prids; b(w,, Vs) 
r=] s=1 T;s 


= * pads = > Prbrsas; = (p'bq);; , 


T;s TS 











logo b' = p'bq. 
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Embora transformações lineares e formas bilineares sejam am- 
bas representáveis por matrizes (quando são fixadas bases), vemos 
que, ao mudarem essas bases, a matriz de uma forma bilinear se 
altera de maneira diferente daquela de uma transformação linear. 

Quando E = F, nos referiremos sempre (salvo aviso em contrário) 
à matriz de uma forma bilinear b: E x E > R relativamente a uma 
única base YU — (u1,...,Um) C E. Essa matriz é b — [b;] e M(mxm), 
onde bi; = b(u;, u;). 

Se b' é a matriz da mesma forma b em relação a outra baseU' c E 
então b' = p'bp, onde p é a matriz de passagem da base 4 para 
a base 4". A correspondência b = b define um isomorfismo entre 
B(E x E) e M(m x m), estabelecido com ajuda da base 4. Dados 
u= Ixiuev= Lyju;em E, se a matriz de b na base U é b — [bi], 
tem-se 


m 
b(u,v) == Do byxiy; . 


Lj—l 


Assim, b(u, v) é um polinômio homogêneo do 2º grau em relação 
às coordenadas deu e v. 

Uma forma bilinear b: Ex E > R chama-se simétrica quando 
b(u,v) = b(v,u) para quaisquer u,v € E. Para que b seja simétrica 
é suficiente que sua matriz em relação a uma base 4 C E seja 
simétrica e é necessário que sua matriz em relação a qualquer base 
de E seja simétrica. Com efeito, se bi; — b;; então 


b(v, u) = PE byyix; = a byxjyi 
bj bj 


= ba byxy — a bagxayp = b(u,v). 
Lj a, 


Observação. O quarto sinal de igualdade na sequência acima faz 
uso de uma manipulação que pode parecer desonesta mas é perfei- 
tamente correta. O princípio é o seguinte: num somatório, o nome 
do “índice de somação”, ou “índice mudo”, não tem a menor im- 
portância: 


m m m 
ZA) ae) nada 
i=] «=1 r=1 
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O que importa é que ao substituir o índice mudo i por 2 (bem como 
j por «) essa substituição se faça em todos os lugares onde i ocorra 
(assim como j) e somente nesses lugares. 

Analogamente, uma forma bilinear b: E x E — R chama-se 
anti-simétrica quando b(u,v) = —b(v,u) para u,v € E quaisquer. 
Para que b seja anti-simétrica é suficiente que se tenha b(u;,u;) — 
—b(u;, u;) ou seja, b; — —b;; numa base (u,,...,Um) C E. 

Uma forma bilinear b, ao mesmo tempo simétrica e anti-simétri- 
ca, deve ser nula. Este fato, juntamente com a igualdade 


1 1 
b(u, v) = 5 [b(u,v) + blvu)l + 5 bu, v) — bl, u), 
mostra que o espaço B(E x E) das formas bilineares b: E x E > R 
é a soma direta de dois subespaços, um deles formado pelas formas 
simétricas e o outro pelas formas anti-simétricas. 


Exemplo 18.1. Dados os funcionais lineares f:E 5 R,g:F5R,a 
função b: Ex F > R, definida por b(u,v) = f(u)g(v), é uma forma 
bilinear, chamada o produto tensorial de fe g. Se E e F são dotados 
de produto interno, fixados u, E Ee vo E F, a função b: E x F > 
R, onde b(u,v) = (u,uo) - (v,vo), é uma forma bilinear. No caso 
particular em que E = F, dados f,g: E > R, funcionais lineares, 
então as igualdades 


(fe g)(u,v) = flu)g(v) + f(v)g(u) 


(FA g)(u,v) = flu)g(v) — f(v)g(u), 


definem formas bilineares feg,fAg: ExE > R, a primeira simétrica 
e a segunda anti-simétrica. 


Teorema 18.2. Seja E um espaço vetorial de dimensão finita provido 
de produto interno. Para cada forma bilinear b: Ex E > Rexiste um 
único operador linear B: E > Etal que 


(u, Bv) = b(u,v) parau,v e E quaisquer. 


A correspondência b —» B, assim definida, é um isomorfismo entre 
os espaços vetoriais B(E x E) e L(E). A forma bilinear b é simétrica 
(respect. anti-simétrica) se, e somente se, o operador B é auto-adjunto 
(respect. anti-simétrico). 
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Demonstração: Para cada v, € E, a função f: E > R, definida por 
f(u) = b(u, vo), é um funcional linear. Pelo Teorema 11.1, existe um 
único vetor em E, que indicaremos com Bv,, tal que f(u) = (u, Bvo), 
ou seja (u, Bvo) = b(u, vo) para todo u E E. Como y, € E é arbitrário, 
acabamos de mostrar que existe uma única função B: E — E tal que 
(u, Bv) = b(u,v) para quaisquer u,v € E. Dados v,v' E E, tem-se 


(u,B(v+v)) = b(u,v+v) 
=b(u,v) +b(u,v) 
= (u, Bv) + (u, Bv) 
= (u, Bv + Bv) 





para todo u € E, logo B(v+v'”) = Bv+Bv'. De modo análogo se verifica 
que B(av) = a(Bv) para « € Rev € E quaisquer, portanto B: E > E 
é linear. Em relação a uma base ortonormal U = (w,...,Uum) EC E, 
o ij-ésimo elemento da matriz de B é (e;, Be;) = b(ei,e;) = ij-ésimo 
da matriz de b. Assim, a forma bilinear b e o operador B que a 
ela corresponde têm a mesma matriz na base 4. Daí decorre que a 
correspondência b » B é um isomorfismo entre B(E x E) e Z(E) e 
que B é auto-adjunto (respect. anti-simétrico) see somente se, b é 
simétrica (respect. anti-simétrica). 














Uma função q: E > R chama-se uma forma quadrática quando 
existe uma forma bilinear b: E x E > R tal que q(v) = b(v,v) para 
todo v E E. 

Se, em vez da forma bilinear b tomarmos a forma bilinear simé- 


trica 
] 


b(u,v) — a 1blu,v) = b(v,u)l, 


teremos ainda 


Pv) = blv,v) = 5 bl) + lv] = b'Iv,v). 


Portanto, não há perda de generalidade em se exigir que a forma 
quadrática p(v) = b(v,v) provenha de uma forma bilinear simétrica 
b. Isto é o que faremos doravante. Com uma vantagem: se b é 
simétrica, todos os seus valores b(u,v) podem ser determinados a 
partir dos valores b(v,v) = q(v) da forma quadrática q. Com efeito, 
tem-se a seguinte fórmula de polarização: 


b(u,v) = but v,u tv) — blu,u) — (vv) 
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Se b = [bj] é a matriz da forma bilinear b na base U = 
(us,...,Um) C E então, para v = Ix;u;, tem-se 


m 
p(v) = >. byxix; ê 


Lj=1 


Note que, sendo b uma matriz simétrica (como sempre supore- 
mos quando tratarmos de formas quadráticas), cada parcela com 
i  j aparece duas vezes na soma acima: uma vez como bi;x;x; e 
outra vez como b;;x;x;, O que é o mesmo. 

A matriz da forma quadrática q na base U é, por definição, a 
matriz b, nesta mesma base, da forma bilinear b tal que q(v) 
b(v,v). Se a matriz de passagem p levar a base YU na base U', a 
matriz b' da forma quadrática q na base U' será dada por b' = p'bp. 

Note que se E possuir produto interno e as bases 4, U' forem am- 
bas ortonormais, a matriz p será ortogonal, logo p' = p”!. Então 
b' = p!'bp. Isto confirma o que foi visto no Teorema 18.1: relati- 
vamente a bases ortonormais a matriz da forma bilinear b coincide 
com a do operador B, que lhe corresponde de maneira intrínseca. 


Teorema 18.3. Seja E um espaço vetorial de dimensão finita munido 
de produto interno. Dada uma forma bilinear simétrica b: ExE >R, 
existe uma base ortonormalU = (uy,...,)Um| C Etal que b(u;,u;) — O 
seij. 


Demonstração: Pelo Teorema 18.2, existe um operador auto-adjun- 
to B:E > E tal que b(u,v) = (u, Bv) para quaisquer u,v € E. O 
Teorema Espectral assegura a existência de uma base ortonormal 
UU = fjoslUnt CE tal que Bu Ate Lo cogm) Então 
1Zj> b(u;,u;) EN (Ui, Bu;) == (Ui, AU) = A; (Ui, Uj) = 0. 














O teorema acima é a versão, para formas bilineares, do Teorema 
Espectral. Por sua vez a versão matricial do Teorema 18.3 é a se- 
guinte: para toda matriz simétrica b = [b;] e M(mxm), existe uma 
matriz ortogonal p € M(m x m) tal que p'bp = p !'bp é uma matriz 
diagonal. A diagonal de d = p!'bp é formada pelos autovalores de 
b, os quais se dizem também autovalores da forma bilinear b e da 
forma quadrática q (v) = b(v,v). 
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Em termos das coordenadas dos vetores u — Ix;ju; ev = Lyju; re- 
lativamente à base YU do Teorema 18.3 a forma bilinear b se exprime 
como 

b(u,v) — DAxiyi é 


Em particular, a forma quadrática q: E 5 R, q(u) = b(u,u), 
para v = Lyju; (expressão relativa à base 4) é dada por uma combi- 
nação linear de quadrados: 


p(v) = LMy? =AMyj + +Amyi. 


É costume numerar os autovalores A; em ordem crescente: Ay < 
Az << Am. 

A forma quadrática q: E — R diz-se não-negativa quando 
p(v) > 0 para todo v E E, positiva quando q(v) > O para todo v £ O 
em E, não-positiva quando p(v) < 0 para todo v E E, negativa quando 
p(v) < O para todo v < O em E e indefinida quando existem u,v E E 
tais que p(u) >0e q(v) <0. 

A forma quadrática q: E — R é não-negativa, positiva, não- 
positiva, negativa ou indefinida, respectivamente, conforme o ope- 
rador auto-adjunto B: E > E, tal que q(v) = (v, Bv), tenha uma 


dessas propriedades, ou seja, conforme os autovalores Ay,..., Am se- 
jam todos > 0, todos > 0, todos < 0, todos < 0Oou Ay <0O<hAm 
respectivamente. 


Se A <--: < Am são os autovalores da forma quadrática q então, 
para todo vetor unitário u E E tem-se À, < qp(u) < Am. Com efeito, 
relativamente à base Y do Teorema 18.3, seu — Ix;u; então E =; 
portanto: 


N=) Mi<) Axi=e()<) Ami=An. 
i i i 


Além disso, q(m1) = À e q(um) = Am. Portanto, o menor au- 
tovalor Ay e o maior autovalor Am são também o valor mínimo e o 
valor máximo assumidos pela forma quadrática q entre os vetores 
unitários de E. 

Em Análise, quando se estudam os pontos críticos de uma função 
diferenciável, um papel crucial é desempenhado por uma forma qua- 
drática, chamada forma Hessiana. Os pontos críticos são classifica- 
dos de acordo com o número de direções independentes ao longo das 
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quais a função tem um máximo relativo e esse número coincide com 
o índice da forma Hessiana, como definiremos a seguir. 

O índice de uma forma quadrática q: E > R é a maior dimensão 
de um subespaço vetorial de E restrita ao qual a forma é negativa. 
Quando q > 0, diremos que o índice de q é zero. 

Portanto, o índice da forma quadrática q: E > R é igual ao 
número i £ O quando: 1) Existe um subespaço vetorial F c E, com 
dim F = i, tal que p(v) < O para todo vetor não-nulo v E F; 2) Se 
G c E é um subespaço vetorial de dimensão maior do que i, existe 
algum vetor não-nulo w E G, tal que q(w) > 0. 

Se dim E = m então toda forma quadrática negativa q: E > R 
tem índice m. 

Assim definido, o índice de uma forma quadrática é uma noção 
intrínseca, independente de escolhas ou construções arbitrárias. 

Outro invariante numérico associado a uma forma quadrática 
p: E >Réoseu posto. Sejab: Ex E >R a (única) forma bilinear 
simétrica tal que p(v) = b(v,v) para todo v E E. Escolhendo uma 
base V = [vi,...,)vVm) € E e pondo b; = b(vi vi), ij = 1,..om, 
sabemos que, para todo vetor 


v= E SM tem-se q(v) = Ea byxix;. 
tj 


Por definição, o posto de q é o posto da matriz b = [b;]e M(m x m). 

Para provar que o posto de q, definido desta maneira, não de- 
pende da base escolhida, observemos que se tomarmos outra base 
V'=(vy,...,Vm) C E a forma q será representada pela matriz b' = 
p'bp, onde p e M(m x m) é a matriz de passagem de V para V”. 
Como p e p! são invertíveis, é claro que b e b' = p!bp têm o mesmo 


posto. 
Em particular, se existir uma base V = (vj,...,Vm| E E tal que 
plv)=Ax+---+Axi (com £O0,...,A £0) 
para todo v = Xxiv;, então a matriz de q na base V tem Ay,...,Ar 


na diagonal e os demais elementos iguais a zero, logo o posto de q, 
igual ao posto desta matriz, é r. 

Se E tem um produto interno e q(v) = (v,Bv) então o posto 
da forma quadrática q é igual ao posto do operador auto-adjunto 
B:ESE. 
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Teorema 18.4. (Lei da inércia, de Sylvester.) Se existir uma base 
V=(vi,...,Vm) C Etal que, para todo v = Ix;v; E E se tem 


p(v) == — exite + 


então a forma quadrática q tem índice i e posto r. 


Demonstração: Já vimos acima que o posto de q é r. Quanto ao 
índice, seja F Cc E um subespaço vetorial, restrito ao qual q é nega- 
tiva. Mostremos que dim F < i. Com efeito, se o vetor não-nulo 


m 
V= ) XjV; 
j=1 


pertencer a F então 





a caco colo a no ca OD 
logo 
+ +x2>0 
e daí (xy,...,x;) £ 0. Isto mostra que a transformação linear A: F > 


Rº, definida por 
m 
Av=— A > v) = (Xp wi); 
Hi 


é injetiva, portanto dim F < i. Para finalizar, observamos que o 


subespaço gerado por v1,...,v; tem dimensão i e, restrita a ele, 
2 à 
plv)=—x,—---—x$ 


é negativa, Logo i é a maior dimensão de um subespaço de E, restrita 
ao qual q é negativa. 














Usualmente, a Lei da Inércia de Sylvester é enunciada sob a se- 


guinte forma equivalente: seja qual for a base V = (vy,...,vm) EC E 
tal que 
p(v) == — ex txt de +? (*) 


para v = Lx;v;, os números i e r são os mesmos. 
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Apresentaremos a seguir o método de Lagrange (de completar o 
quadrado) para obter uma base no espaço vetorial E, relativamente 
à qual uma dada forma quadrática q: E —» R tenha uma matriz 
diagonal cujos elementos não-nulos são iguais a 1 ou —1. Noutras 
palavras, nessa base, q tem uma expressão do tipo (*) acima. 

Comecemos com uma base qualquer 4 = (u,...,um) € E, na 
qual se tem 


p(v) => dyxx; a 
1j 


para v = xjuy +: +Xxmum. Se a = la;l e M(m xm) é a matriz de 
passagem da base U para a base V = (v;,..., vm), à nova expressão 


p(v) => eguiy; 
ij 


para v = yjVI + -:: + YmVm, Se obtém simplesmente efetuando em 
(**) a substituição, ou mudança de variáveis, 


Xi = Do GkYk, X = = AjkUk- 
k k 


De agora em diante, mencionaremos apenas cada mudança de 
variáveis, deixando implícito que ela corresponde à passagem de 
uma base para outra pois, em cada caso, a matriz a = [ai] [ou o 
que é o mesmo, o operador (y7,...,Um) + (x1,...,Xm)] é invertível. 

A partir da expressão 


p(v) =>. byxix;, 
bj 


faremos, se necessário, uma mudança de variáveis para assegurar 
que algum elemento b;; da diagonal seja diferente de zero. (Estamos 
supondo que q não seja identicamente nula, do contrário nada ha- 
veria a fazer.) Pois se todos os elementos da diagonal fossem iguais 
a zero, escolheríamos um bs £ 0, com r £s e faríamos a mudança 
de variável x = yr +UYs,Xs =UY —Us, X =UYi (sei é (r,s). Então a 
parcela 2b,,x,xs da soma q(v) se transformaria em 2b,sy? — 2b,sy? e 
agora, nas novas variáveis y;, a expressão de q(v) contém ao menos 
dois termos não nulos, cy? = 2b,sy? e cssyZ = —2b,sy?, os quais não 
se cancelam com nenhuma das outras parcelas. 
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Voltemos à expressão qp(v) = Lbyx;x;, onde podemos agora su- 
por que algum bi; 2 O. Mudando, se necessário, a numeração das 
variáveis (o que equivale a mudar a ordem dos vetores da base), po- 
demos admitir que bj; % O. Então escrevemos 


ev) =dn |[xi+2x DD gg) +b(v), 
j>2 
onde c; = b1;/b11 e rb(v”) depende apenas de 
ve a Xl; 
j>2 


ou seja, é uma forma quadrática definida no subespaço F C E, 
de dimensão m — 1, gerado por uz2,...,Uum. À expressão dentro dos 
parênteses acima é do tipo a? + 2ab, logo é igual a (a+b)? — b?, onde 


ax, e b=* em 


j>2 
Assim, a mudança de variáveis 
Z =X +53 ox, DX, -sZ&m=Xm 
j>2 
ou, equivalentemente, 
N=2n-)D 92; X2 — Z2,..,Xm — Zm; 
j>2 


mostra que a expressão dentro dos parênteses acima é igual a 


2 


2 
mM — 2.6 , 


j>2 


portanto 


g(v) = bz) — bn > Ga +W(v) 
j>2 
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ou seja, p(v) = bz + E(v”) onde, outra vez, E é uma forma quadrá- 
tica no subespaço F, de dimensão m — 1. Efetuando a nova mudança 


de variáveis 7 
1 


n=—>—, 5=y 0622), 
fem O * 


obtemos q(v) = +yt + E(v). Aplicando o mesmo método a E e pros- 
seguindo analogamente, chegaremos no final a 


p(v) — ra +yz 








ou, mais explicitamente: 





2 É pd 2 

1 Yi HU + + 

onde i é o índice e r o posto da forma quadrática q. Os números 
y; são as coordenadas do vetor v na base de E obtida após a última 
mudança de coordenadas. 


p(v) =—y 


Exemplo 18.2. Seja q: RÉ > R a forma quadrática dada por 
p(x,y,z)= 2x) + 2yº — 27º + 4xy — 4xz + Byz. 
Completando o quadrado, vemos que a soma das parcelas que con- 

têm o fator x se escreve como 
2x2 + 4xy — 4xz = 2x? + 2x(y — 2)] 
=2x2+2x(y-—2z)+(y—2)]—-2(y— 2) 
=2(x+y-— à de 2(y — a 





A mudança de variáveis s = x + uy — z nos dá então 
p(x,y,Z) — 28º = 2(y — z + 2y” = 2272 + 8yz 
=28=42º + ya. 


Novamente completamos o quadrado, agora na soma das parcelas 
que contêm z, e obtemos 


—47? + Nyz=—4 (2 — 22: E) 





3 9 
= a(2 eu tu?) + 9y? 
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A mudança de variáveis t = z — 5y nos dá portanto 
p(x,y,z) =282—4t + 9y?. 


Isto já nos diz que a forma quadrática q tem posto 3 e índice 1, logo 
é indefinida. 
Se quisermos, podemos fazer a mudança de variáveis 


O qobo got 


> E 


e teremos 
p(x,U,Z) = ví —y + us. 


Evidentemente, não há dificuldade em obter a expressão das va- 
riáveis y1, Yz € y3 em função de x, y, z e vice-versa. Mas, para efeito 
de conhecer o índice e o posto de q, isto é desnecessário. 


Quádricas 


O estudo das formas quadráticas tem uma aplicação interessante 
à Geometria Analítica n-dimensional, que apresentaremos breve- 
mente aqui. 

Um subconjunto » c R” chama-se uma quádrica central quando 
existe uma forma quadrática q: R” — R tal que > é definido pela 
equação q(v) = 1. 

Se 


p(v) = a Alij XiXj 
ij 


para v = (x1,...,Xn), isto significa que L é o conjunto dos pontos 
(x1,...,Xn) € R” tais que 


n 
) Qi; XX — 1. 
Lj=] 


Segue-se imediatamente do Teorema 18.3 que, dada uma quádri- 
ca central » Cc R”, existe uma base ortonormal U = (uy,..., um; em 
R”, relativamente à qual a equação de 2 é 


My +Ayn =], 
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onde A1,..., An são os autovalores da matriz simétrica la). 

Noutras palavras, quando se exprime o vetor v = yju)+:--+yYnUn 
como combinação linear dos elementos da base 4, tem-se v E 1 se, e 
somente se, suas coordenadas y1,...,Un satisfazem a equação 


> ME E 


As retas que contêm os vetores u; da base 4 chamam-se os eixos 
principais da quádrica central >. 

Quando n = 2, +» chama-se uma cônica. Portanto, a cônica defi- 
nida em R? pela equação 


ax? +2bxy + cy” = 1 


pode, numa nova base ortonormal de R?, ser representada pela e- 
quação 
As? +ut= 1, 


; b 
onde À, | são os autovalores da matriz N | . 
Segundo os sinais desses autovalores, as seguintes possibilidades 


podem ocorrer: 


1º) Se Au < 0 (isto é, ac < b?) tem-se uma hipérbole. 
2º) SeA>0eu>0O(istoé,a>0€e ac > b?) tem-se uma elipse. 


3º) SeA<0eu<Olistoé,a<0eac> b?) tem-se o conjunto 
vazio. 


4º) Se Au = 0 (isto é, ac = b?) tem-se um par de retas paralelas, ou 
o conjunto vazio, conforme sejaa+c>00oua+c<o. 


Evidentemente, quando À = u > 0 tem-se uma circunferência. 


É claro que, em cada caso concreto, dada a equação ax? + 2bxy + 
cy? — 1, uma aplicação imediata do método de Lagrange (de comple- 
tar o quadrado) permite escrever o primeiro membro sob a forma 
byys + boys e daí constatar, conforme os sinais de b; e bs, se se 
trata de elipse, hipérbole ou um par de retas. Convém ter em conta, 
porém, que o método de Lagrange, embora eficiente (principalmente 
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em dimensões maiores do que 2, onde é muito difícil calcular os au- 
tovalores), não fornece bases ortonormais. Em particular, ele não 
permite distinguir uma elipse de uma circunferência. 

Em dimensão 3, as superfícies quádricas centrais L c Rº têm, 
num sistema de coordenadas ortogonais conveniente, uma equação 
do tipo 

My + Aus + Asyg = 1 
1y1 24 TAGs — da 


As possibilidades são as seguintes: 
1º) SeA >0,M >0€eA3>0, E é um elipsóide. 
2º) SeA >0,A>0€eA3;<0, XL é um hiperbolóide de revolução. 
3º) Se >0,A<0€eA;<0, X é um hiperbolóide de duas folhas. 
4º) SeM,AM e A; são <0, X é o conjunto vazio. 
5º) SeA; =0,L=CxR=[I(vt);veC,te R), onde Cc R? é 
definido pela equação 
Myt + Mys = 1. 


Neste caso, » é um cilindro de base C. 


Observe que, mudando a numeração das coordenadas se neces- 
sário, podemos sempre supor A; > 0. 

Há outro tipo mais geral de quádricas, além das centrais. São 
subconjuntos » C R” definidos por uma equação do tipo 


n n 
) Cij XX; + ) Dx sc. 
tj=i = 


A escolha de uma base ortonormal conveniente em R” faz com 
que esta equação assuma a forma 


T Tn 
DAW+ bm=o, 
i=] i=1 


onde r é o posto da matriz la;le A £0,...,Ah £0. 
Procurando eliminar o termo linear >b/y; mediante escolha de 
novas coordenadas, somos levados a efetuar uma translação. (Até 
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agora nossas mudanças de coordenadas eram feitas por meio de 
transformações lineares, logo preservavam a origem.) Introduzindo 
as novas coordenadas 


4 


Auta (= 1 assT); 
Z141 = Ur+, 
Zn = Un; 


a equação acima se torna 
2 2 , , nn: 
Ag + tz + +Dbm =, 


na qual conseguimos eliminar os r primeiros termos lineares. 

Pode ocorrer que os coeficientes bj sejam todos iguais a zero. 
Neste caso, a forma simplificada que buscamos para a equação da 
quádrica X é: 

A+ tAgd=d. 


Ser =n, » é simplesmente a figura que resulta de uma quádrica 
central depois de uma translação. Ser < n então as últimas n — 1 
coordenadas z,,1,...,Z2n podem ser tomadas arbitrariamente, en- 
quanto as r primeiras definem uma quádrica em R”, logo X é um 
cilindro generalizado: produto cartesiano » = »' x R"” onde X' é 
uma quádrica em R”. 

Se algum dos números bj (r+1<j5<n) for 0, introduziremos 
novas coordenadas ty,...,tn detal modo que ty =2j,..,t; =Z € 


DijZda a biz = c' — dty. 


Primeiro fazemos uma translação de modo a eliminar c'. Para isso 
escolhemos um ponto (zº .Z2) tal que 


reDe 
! o 150 0 4 
biz fc ==.€. 


e escrevemos 


o o 
SMS, SA ZapeeoSn=>Mm— Za 
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Então, nas coordenadas s;, a equação da quádrica > se torna: 
As desses Apso e blusa Perth sd 
No espaço R"”, a expressão 
bis + +bisn 
é o produto interno (b, w), onde 
= geada 6 rs Bum is indi 


Escolhamos nesse espaço uma base ortonormal cujo primeiro ele- 


mento seja o vetor unitário u = b/|b|. Sejam (t,,1,...,tn) as coor- 
denadas do vetor w = (s,,1,...,Sn) nesta base. Então ty = (u,w), 
logo (b,w) = |blt,,j. Escrevendo ty = s1,...,tr = Sr, vemos que, nas 


novas coordenadas t; a equação da quádrica » assume a forma: 
2 2 — 
Mt «- Rene + Ati + dt, — 0, 


onde d = |b]. 

Observemos que todas as mudanças de coordenadas foram fei- 
tas mediante translações e transformações lineares ortogonais (ou, 
o que é o mesmo, escolhas de bases ortonormais). Podemos então 
concluir que, dada uma quádrica: 


n n 
>: pa Cij XX; + >. bx; =c (=) 
ij=l i=l 


em R”, existe uma mudança de coordenadas 
n 
Xi = mg +k (i= 1,...,n) 
j=1 
tal que m = [mi] é uma matriz ortogonal e, efetuando essa transfor- 
mação na equação (*) de >, ela se torna 
MNU+-+AB+dta=o0, (d%O0) 


ou 
t+ pit, 
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onde r é o posto da matriz la; e M,...,A são os seus autovalores 
não-nulos. No primeiro caso, supondo r = n — 1, a quádrica » pode 
ser definida por 

te E at) desde A 


(com «; = —A;/d) e chama-se um parabolóide. 
Exercícios 


18.1. Determine a matriz de cada uma das formas bilineares abaixo, 
relativamente à base especificada: 





(a) b:R*xRº5R, b(u,v) = (u,v), base (vi, vz,v3,v4) C Rº, onde 
vi=(-2,0,3,1), vz=(1,2,1,—1), v3=(0,1,2,—1), va=(1,2,3,1). 





(b) b:R"xR?º 5R,b(u,v) = (Au,v), À E L(R"), base canônica 
de R”, 





(0) D:R?xR" 5 R,b(u,v) = (Au, Bv), A,B € L(R"), base canônica 
de R”, 











(d) B:R"xRº5R,b(u,v) = (u,a)-(v,b), a,b E R”, base canônica 
de R?. 











18.2. Seja q: Rº > R a forma quadrática dada por q(x,y,z) = x? + 
yu? — 2? + 2xy — 3xz + yz. Qual é a matriz de q na base (u,v,wj c Rº, 
odeu=Bols=lal ZM wv=li 


18.3. Prove que o conjunto das formas quadráticas no espaço veto- 
rial E é um subespaço vetorial Q(E) c F(E;R). Se dim E =n, prove 
que dim Q(E) =n(n + 1)/2. 


18.4. Assinale V(erdadeiro) ou F(also): 


( ) O conjunto das formas quadráticas de índice i no espaço veto- 
rial E é um cone convexo em F(E;R). 


( ) A matriz do operador B: E > E na base 4 é igual à matriz da 
forma bilinear b(u,v) = (u, Bv) na mesma base. 
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( ) As formas bilineares b e b*, que correspondem aos operado- 
res B e B* segundo o Teorema 18.2, definem a mesma forma 
quadrática q(v) = b(v,v) = b*(v,v). 


( ) O operador auto-adjunto B: E > E e a forma bilinear simétrica 
b: Ex E > R, que lhe corresponde conforme o Teorema 18.2, 
têm a mesma matriz relativamente a qualquer base de E. 


18.5. A matriz de uma forma bilinear b: ExE na base U=(m,...,Un) 
c E é dada por bi; = b(u;,u;). Supondo conhecida a forma quadrá- 
tica q: E > R, como se pode obter a matriz de q na base 4 a partir 
dos seus valores p(v), ve E? 


18.6. Sejam f,g: E > R funcionais lineares. Prove que a forma 
bilinear anti-simétrica fA g: E > E, definida por (f A g)(u,v) = 
f(lu)g(v) — f(v)g(u), é identicamente nula se, e somente se, um dos 
funcionais dados é múltiplo do outro. 


18.7. Seja b: Ex E > R uma forma bilinear anti-simétrica no espaço 
vetorial E, de dimensão finita. Prove que as seguintes afirmações 
sobre b são equivalentes: 


(1) Tem-se b = f A g, onde f,g e E*. 


(2) Existe uma base V = [vi,...,Vn) C E tal que b(v;,v;) = O se 


ijAU,2. 


Conclua que toda forma bilinear em Rº é do tipo b = fA Gg. 
E em Rº? 


18.8. Seja b: Rº x Rº — R uma forma bilinear anti-simétrica. Prove 
que existem números «, 3 e uma base (vi, v2, V3, V4, 5) C Rº tais que 
b(vi,vz) = —b(vz,vi) = «, b(v3,v4) = —b(vs,v3) = Be b(vi,v;) = O nos 
demais casos. Conclua que existem funcionais lineares 
fi, fo, f3,f4: Rê — Rtais que b=f, A fo 4f3 A fa. 


18.9. Sejam E, F espaços vetoriais de dimensão finita, com produto 
interno. Estabeleça um isomorfismo natural entre B(E x F) e Z(E;F). 
Determine a relação entre as matrizes de uma forma bilinear e da 
transformação linear que lhe corresponde. 
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18.10. Dados os funcionais lineares f,g: E > R, considere a forma 
bilinear f& g: Ex E > R (produto tensorial de f e g) definida por 
(fo g)(u,v) = f(u)- g(v). Prove as seguintes afirmações: 


(a) fog=0>5f=00ug=0. 
(b) fo g = g 8 f & um dos funcionais f, g é múltiplo do outro. 


(c) Se fi ...,fn) c E* é uma base então as formas bilineares f; & f; 
constituem uma base de B(E x E). 


(d) Nas condições do item (c), as formas f; ef; — f,Of;+f;& f;, com 
i < 5, constituem uma base para o espaço das formas bilineares 
simétricas. 


(e) Com a notação de (c), as formas f Nf; = fi.9f;—f, & fi, com 
i <j, constituem uma base para o espaço das formas bilineares 
anti-simétricas. 


18.11. Dada a forma quadrática q: R? > R, com q(x,y) = 2x2 —-y? + 
3xy, ache uma base ortonormal (u, v) C R? e números A, u tais que, 
para todo vetor w = su +tv € Rº se tenha q(w) = As? + ut?. 


18.12. Dada a matriz simétrica 
4 1 
b=i a) 
ache uma matriz ortogonal p tal que p' bp seja uma matriz diagonal. 
A partir daí obtenha uma base ortonormal (u, v) € R? tal que a forma 


quadrática q: R? > R, com q(x,y) = 4x? +2xy + 2yº se escreva como 
p(w) = As? + ut? para todo vetor w = su + tv. 


18.13. Dadas as formas quadráticas abaixo, use o método de La- 
grange para exprimi-las como somas e diferenças de quadrados e, a 
partir daí, determine o índice e o posto de cada uma delas: 


(a) qloy)=x"+9y” + 6xy 
6) blx,y) =x? + 8y? + 6xy 
(o) Exyd=i+y+Z2-Iaz+y — Zyz 
(d) Uxuy,z) = 8x2 + 36yz — 6y? — 277º — 24xy 
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18.14. Dada a forma quadrática q: R? > R, com q(x,y) = ax? + 
bxy + cy”, escreva-a como 


2 
RONNIE 
ecso=ve(5) e0(5) ve 


=vylat?+bt+c), t=x/y, 


e use o trinômio at? + bt + c para obter condições sobre a, b, c que 
caracterizam se q é positiva, negativa, indefinida, não-negativa ou 
não-positiva. 


18.15. Seja A: E > F uma transformação linear invertível. Para 
toda forma quadrática: F>R, prove que q = po A: E > R é uma 
forma quadrática em E, com o mesmo índice e o mesmo posto que 1. 


18.16. Prove que todo operador linear invertível A:R”" > R? trans- 
forma uma quádrica » € R” noutra quádrica de mesmo tipo. 
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Determinantes 


O determinante surgiu inicialmente nas fórmulas que exprimem a 
solução de um sistema determinado de n equações lineares a n in- 
cógnitas. Posteriormente, ele foi identificado como a área de um pa- 
ralelogramo ou o volume de um paralelepípedo e depois, de forma 
definitiva, como a função multilinear alternada da qual todas as ou- 
tras se deduzem. 


Tradicionalmente se tem o determinante de uma matriz quadra- 
da, ou de uma lista de vetores, que são as colunas (ou linhas) dessa 
matriz. Em Álgebra Linear, é mais apropriado falar do determinante 
de um operador linear. Seu interesse aqui decorre principalmente do 
fato de que um operador é invertível se, e somente se, seu determi- 
nante é diferente de zero. A partir daí, o determinante fornece um 
polinômio de grau n cujas raízes reais são os autovalores de um ope- 
rador num espaço vetorial n-dimensional (polinômio característico), 
polinômio esse que estudaremos na seção seguinte. 


Faremos aqui uma breve apresentação do conceito de determi- 
nante e de suas principais propriedades. Nosso ponto de partida são 
as funções multilineares, mais especificamente as alternadas. 


Em toda esta seção, E representa um espaço vetorial de dimensão 
n, no qual todas as bases que tomaremos serão ordenadas. 
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Uma forma r-linear no espaço vetorial E é uma função 
f:Ex-..xESR, 


definida no produto cartesiano E x --- x E = E”, que é linear em cada 
uma das suas variáveis, isto é: 


/ / 
fps VE Pers Ve) = TVA, css es) TPI essa Vigances Ve) 
(VI, ses Vis ess Ve) = 0F(Vip e ces Vis caos Ve); 
para vi,...,V5V;...,Vr E Ee a ER quaisquer. 
Se f é r-linear e um dos vetores vj,...,v; é igual a zero então 


f(vi,...,Vr) = 0, pois 


Elas ta seg DO ua) = Diga = O, 


Teorema 19.1. Seja U = (u,,...,un) € E uma base. Para cada uma 
das n” listas ordenadas J = (jy,...,jr) de inteiros compreendidos en- 
tre len, fixemos um número real ay — a;,j,..;,- Existe uma, e somente 
uma, forma r-linear f: Ex--.xE — Rtal que f(u;,,...,u;,) — ay para 
todo D= 1...sjr). 


Noutras palavras, uma forma r-linear f: E” > R fica intei- 
ramente determinada quando se conhecem seus n” valores 
f(1,,..., U;,) nas listas de elementos básicos, e esses valores podem 
ser escolhidos arbitrariamente. 


Demonstração: Para facilitar a escrita, tomemos r = 3. O caso 
geral se trata igualmente. Suponhamos dado, para cada lista (1,j,k) 
de números naturais compreendidos entre 1 en, um número real 
ai. Definamos f: E x E x E > R pondo 


Tn 
f(u,v,w) = > CijkXiUjZk, 
Lj,k=1 


W= ) Mali v=> yu e w=> za. 


Verifica-se facilmente que f, assim definida, é trilinear e que 
flu, u;, uk) = ak. Além disso, seg: Ex Ex E > R é trilinear e 
g(u;, u;, uk) — ak para 1,j,k = 1,...,n quaisquer, então para 


ques DE v=5 yu; e w=53 za. 


se 
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arbitrários, tem-se 
901, vw) =9(D Xu, uu) zm) 
= 5 xyzx 9(u, 1; Ux] 
= >. AjkXiUjZk = f(U, v, W), 














logo g = f. 
Corolário. O espaço vetorial L,(E;R) das formas r-lineares 
f:Ex-..x Es R tem dimensão n'”. 


Com efeito, uma vez fixada a base 4 c E, o Teorema 19.1 faz 
corresponder, biunivocamente, a cada f E L,(E;R) os n” números ay. 
Isto determina um isomorfismo entre L,(E;R) e R””. 














Uma forma r-linear f: Ex--.xE — R chama-se alternada quando 
f(vi,...,Vr) = O sempre que a lista (vy,...,v,) tiver repetições, ou 
seja, quando 


DV ses it, MT pre o Mio, Va pa) =0 


para quaisquer v,vj,...,V;, E E. 


Teorema 19.2. Uma forma r-linear f: Ex --.x E > R é alternada 
se, e somente se, é anti-simétrica, isto é, 


Ega Vira sa) =D ppa pais Piguado Vo) 
para quaisquer v1,...,v; E E. 
Demonstração: Por simplicidade, escrevamos 
Tvis. SUS cs Vi) = plu,v). 


Então, f alternada implica q(u,u) = q(v,v) = qp(lu+vu+v) = 0, 
logo 


O=q(lu+vu+v)=q(u,u) + q(uyv)+q(v;u) + p(v,v) 
e q(u,v) + p(v,u), 


portanto p(u,v) = —qy(v,u), de modo que f é anti-simétrica. Re- 
ciprocamente, se f é anti-simétrica então q(v,v) = —qy(v,v) logo 
2p(v,v) =0, p(v,v) = 0 e f é alternada. 
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Corolário. Seja f: Ex--.x E — Rr-linear alternada. Para toda per- 


mutação o dos inteiros 1,2,...,7, e toda lista de vetores vi,...,vr E E 
tem-se 
f(ve(), au. »Vo(r)) — Ego f(vi, PR Vi), 
isto é, 
f(ve(1) core Vai) — +>f(vi, eres VT), 
onde o sinal é + se oc é uma permutação pare — se o é uma per- 


mutação ímpar. (Vide Apêndice.) 


Com efeito, passa-se da sequência (vi,...,vr) para (Vs(1),-.., Vo(r) 
mediante k transposições sucessivas, que correspondem a k mudan- 
ças de sinal no valor de f. Como es = (—1)*, o corolário segue-se. 














A notação A,(E) indica o espaço vetorial das formas r-lineares 
alternadas f: Ex --.xE SR, 


Exemplo 19.1. Dados os funcionais lineares fy,.. sf: E 5 R,a 
função f: Ex--.x E > R, definida por 
Flv, . oo Vi) = filvi) alva) fi(vr) 


é uma forma r-linear, chamada o produto tensorial dos funcionais 
lineares fj,...,fr. 

Exemplo 19.2. Todo funcional linear f: E > R é uma forma 1-linear 
alternada, já que não é possível violar a condição de anti-simetria. 
Portanto Aj(E) = E+*. 

Exemplo 19.3. Qualquer aplicação r-linear f: Rx --.-.x R > R é do 
tipo f(ty,..,t;j)=a-ty-tz---t;, onde a = f(1,...,1). (Vide Teorema 
19.1.) Quando r > 1, f só pode ser alternada quando a = 0. Logo 
A(R) =(0) ser > 1. 

Exemplo 19.4. A forma f: Rx R? — R, definida por f(u,v) = xjyz— 
x2y1 quando u = (x,,x2) ev = (y1,y2), é bilinear alternada. Se 
g:Rº? x Rº > R é qualquer outra forma bilinear alternada em R? 
então, pondo c = g(e1,e2), vem: 


g(u,v) = g(x1e1 + x2e2,Y1e1 + Vzez) 
= x1y19(e1,e1) + xiyzgler, ez) 
=P uindles,ei) = Raypgleses) 
= (x1y2 — xzyi )g(e1, ez) 
=c- (xyz —x2y1) =c-f(u,v) 
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pois g(er,ei) = g(ez,e2) = 0 e g(ez,e1) = —g(e1,ez). Isto mos- 
tra que toda forma bilinear alternada g é um múltiplo de f, logo 
dim A,(R?)= 


Teorema 19.3. Seja f: E x... x E > R r-linear alternada. Se os 
vetores v1,...,Vvr forem L.D. então f(vi,...,v;) = 0. 


Demonstração: Isto é claro se v; = O. Caso contrário, um dos 
vetores, digamos v;, é combinação linear dos anteriores: 


Vi=— = OjVj. 
j<i 
Então 


T(vi, sv) = f(vs,.. cado ipa 5 Vr) 


j<i 


=" ut ipa sis Mara Ma si) = O 


j<i 











pois f é alternada. 





Corolário 1. Se existe uma forma r-linear alternada f: E x -.. x 
ES Rtal que f(vi,...,;vr) £ O então os vetores vy,...,vr E E são 
linearmente independentes. 


Corolário 2. Se 7 > dim E então A-(E) — (0). 





Com efeito, sendo r > dim E, quaisquer r vetores vj,...,Vr são 
linearmente dependentes, logo f(v,,...,vr) = O para todo f E 4, e 
todos vy,...,vr E E. 











A partir de agora, concentraremos nosso interesse nas formas 
n-lineares alternadas, f ce A,(E), onde n = dim E. O resultado fun- 
damental é o teorema seguinte e, principalmente, seu Corolário 1. 


Teorema 19.4. Seja 4 = (u,,...,un) uma base de E. Dado arbitra- 
riamente um número real a, existe uma única forma n-linear alter- 
nada f: Ex-:-.xE»Rtal que f(w,...,Un)=a. 


Demonstração: Suponhamos inicialmente que exista f e An(E) tal 
que f(uy,...,Un) = a. Seg E An(E) for tal que g(u;,...,un) também 
é igual a a, então para toda lista de vetores u;,,...,u,, €U tem-se: 


iss] = Teses); 
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se houve repetições na lista; 


Giga cost = pese paga) 

= Eog(u1,...,Un) 

— Ega 

= €o f(Uy,...,Un) 

= f(u, spas 
se (iy,...,in) = (o(1),...,0(n)) for uma permutação dos inteiros 
(1,...,n), isto é, se não houver repetições na lista. Segue-se então 
do Teorema 19.1 que f = g. Portanto a forma n-linear alternada f 
fica determinada por seu valor f(uy,..., Un). 

Isto nos indica como obter uma forma n-linear alternada 
f:Ex-..xE Ss Rtal que f(u,,...,un) = a. Para toda lista or- 
denada (ij,...,m) de inteiros compreendidos entre 1 en, poremos 
f(u;,,...,Ui,) = O se houver repetições na lista, f(w,,...,Ui,) = 
a se (iy,...,m) for uma permutação par dos números 1,2,...,n e 
f(u;,,...,W,) = —a se a lista iy,...,in for uma permutação ímpar 
dos números 1,2,...,n. Pelo Teorema 19.1, há uma única forma n- 


linear f: Ex---x E — R com estas propriedades. Resta provar que f é 
alternada. Com esse objetivo, tomamos um vetor v = x;u; qualquer. 
Então: 


n 
f(xv x va) = Do XiX; f(*u; + U;x) 
ij=l 
= o XXifisu; * Ux) + a Xix;f (+; * U;*) 
i i<j 
+ > xsfteu * U;*) 
i>j 
0+ >. Xix;f(+u; + Us*) — a XiX; f(+1; * U;*) 
i<j i>j 
pa Xixjf (eu; + u;x) — . Xjxif(*u; + u;x*) 


i<j i<j 


3 
= Ea xix;f (+; + Us*) — a xixyf(+u; + x) — O. 


i<j i<j 
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Acima, os asteriscos estão em lugar de n — 2 vetores que perma- 
necem fixos durante a argumentação. A igualdade (1) usa o fato de 
que f(+u; + u;+) é uma função (n — 2)-linear desses vetores, que satis- 
faz a condição f(+u; + u;*) = —f(xu; + u;*) quando esses n — 2 vetores 
pertencem à base Y logo, pelo Teorema 19.1, esta igualdade vale em 
geral. Segue-se que f(+u; *u;*) = O. Na igualdade (2) foram trocados 
os nomes dos índices mudos 1, j. Finalmente, a igualdade (3) usa 
apenas que x;X; = XjXi. 














Corolário 1. Se dim E = n então dim A,(E) = 1. 


Com efeito, fixada a base U = (w,...,un) E E, existe f e An(E) 
tal que f(uy,..., un)=1. Então, para toda ge An(E), se g(m,..,un)= a 
tem-se também (af)(1,...,un) = a, logo g = af. Portanto, (f) é uma 
base de An(E). 


Corolário 2. Se (u;,...,un) CE éuma basee O £Lf E An(E) então 
Tigas O 


Com efeito, pelo Teorema 19.4 existe fo ce Anf(E) tal que 
foluy,...,Un) = 1. Pelo Corolário 1, f = afo, com a £ O. Logo 
f(u,...,Un) = afo(m,.. Uh) = £0. 


























Toda transformação linear A: E > F induz uma transformação 
linear A*: An(F) > An(E), a qual faz corresponder a cada forma n- 
linear alternada f: Fx-..xF—» R anova forma A*f: Ex -..xE5R, 
definida por 

(A*f) (vi pe. Yn) = f(Avi ,000) Avn), 


onde vj,...,Vn E E. É fácil verificar que realmente A*f € An(E), que 
(BA)* = A*Bf e If = I. Se A for um isomorfismo, A? também será, 
com (A*)! = (ATP, 

Seja agora A: E > E um operador linear. 

Como dim An(E) = 1, o operador linear A*: A,(E) > An(E) con- 
siste na multiplicação por um número real, que chamaremos o deter- 
minante do operador A: E — E e indicaremos com a notação det A. 
Assim, por definição, A*f — det A - f, isto é, 


f(Avi,..., Avn) = det À -f(vi,...,Vn) 


para toda f: E x -.. x E > R n-linear alternada e quaisquer v,..., 
vr E E. 


252 Determinantes Seção 19 


Isto define o determinante de um operador de modo intrínseco, 
sem recurso a bases ou matrizes. A seguir mostraremos como obter, 
a partir desta definição, as formas clássicas de apresentar o determi- 
nante. De imediato, veremos como é fácil provar duas propriedades 
cruciais do determinante. 


Teorema 19.5. Se A,B:E > E são operadores lineares então 
det(BA) — det B- det A. 


Demonstração: Sejam (v,,...,vn; C E uma basee O £f e An(E), 
logo f(vi,...,Vn) £ 0. Então 


det(BA).f(vi,...,vVn) = f(BAvi,..., BAvn) 
= det B.f(Avi,..., Avn) 
= det B.det A.f(vi,...,Vvn), 





portanto det(BA) = det B - det A. 











Corolário. Se A: ESE é um operador não-negativo então det ADO. 


Com efeito, existe B: EE tal que A=B2, logo det A=(det B)?>0. 














O teorema abaixo mostra que det À > O quando À é positivo. 


Teorema 19.6. O operador linear A: E — E é invertível se, e somente 
se, det A £ 0. No caso afirmativo, tem-se det(A!) = (det AJ]. 


Demonstração: Se existe A”!, então de AA! — I resulta 
det A.det(A !) = det(AA !) = det 1 =1, 


logo det A * 0 e det(A”!) = (det A)!. Reciprocamente, se det A £ 
O então, tomando uma base (v;,...,vn) C E e uma forma n-linear 
alternada não-nula f: E x -.. x E — R temos 


f(Avy,..., Avn) = det A.f(vi,..,vn) £O0, 


logo, pelo Corolário 1 do Teorema 19.3, os vetores Av1,..., Av, cons- 
tituem uma base de E. Assim, À é invertível. 














Corolário. O sistema de equações lineares Ax = b, com À E L(R?), 
possui uma única solução se, e somente se, det À £ 0. 
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Definamos, a seguir, o determinante de uma matriz quadrada. 
Dada a e M(n x n), escreveremos, de agora em diante, a = 


[v1,..., Vn] para significar que vy,...,Vn são os vetores-coluna da 
matriz a. Seja A:R” > R” o operador linear cuja matriz na base 
canônica de R" é a, ou seja, Aey = v1,...,Ãen = Vn. 


Por definição, o determinante da matriz a é igual a det A. 
Assim, se f; E An(R?) é a forma n-linear alternada tal que 


foley,...,en) = 1 (vide Teorema 19.4) então 
det a = det À = det A.fo(er,...,en) = fol(Aey,...,Aen), 
ou seja: 
det a = fo(vi,...,Vn). 


Portanto det: M(n xn) > Ré a única função n-linear alternada 


das colunas da matriz a = [v1,...,Vn] que assume o valor | na matriz 
identidade L,. 

Para uma qualquer função n-linear alternada f(a) = f(vi,..., 
vn) das colunas da matriz a = [vi,...,Vnl, tem-se evidentemente 
f(a) =f(v,,...,vn) = c-det a, onde c = f(L,) = f(ey,...,en). 

Escrevemos detlv;,...,Vn! para indicar o determinante da ma- 
triz cujas colunas são os vetores v1,...,Vn € R?. A afirmação acima 


destacada é a caracterização axiomática dos determinantes feita por 
Weierstrass. Segundo ela, todas as propriedades dos determinantes 
podem, em princípio, ser deduzidas das seguintes: 


1) detl...,vi + w;...] = detl...,v;.. ] +detl..,wi...); 
2) detl...,avi,.. | = «- detl...,vi...; 

O) Dbi Vas ppa] = detail 

4) detles,...,en] = 1. 





Por exemplo, vale: 


5) O determinante de uma matriz não se altera quando se soma a 
uma de suas colunas uma combinação linear das demais. 


Seja 


W = ) OjVj. 


jÃ 
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A afirmação acima significa que 
detlvi,.. vi + W,...,Vn] = detlvy,..., Vi... Va], 


o que é claro pois a segunda parcela do segundo membro abaixo é 
zero, pelo Teorema 19.3: 


detl...,vi +w,...,) = detl...,v;.. J+detl...,w,...]. 


Como aplicação de 5) temos o 


Exemplo 19.5. O determinante de uma matriz triangular é igual 
ao produto dos elementos de sua diagonal. Com efeito, seja t — [ti] E 
M(n x n) triangular superior. Escrevendo t = [v,...,vn], temos 


vi = tres, 
v2 = tizey + tozez, 
v3 = tj3e1 + t,3€2 + t33€e3, etc. 


Portanto 


det t = detltyey,v2,...,Vn] 
= ty detley, tizey + t22€2,V3,...] 
= tyit>z detles, ez, ti3e1 + tz3e2 + t33e3, V4,...] 
= tyit>>ts3 detles, ez, e3,V4,.. . 


Prosseguindo analogamente, chegamos a 
det t = tit>2... tmn. 


Dos Teoremas 19.5 e 19.6 resulta que det(ba) = detb - det a 
e que deta O se, e somente se, existe a!. No caso afirmativo, 
det(a !) = (det a). 


Exemplo 19.6. (Regra de Cramer.) Seja a e M(nxn) uma matriz 
invertível. Dado b € R”, indiquemos com o símbolo ali; b] a matriz 
obtida de a quando se substitui sua i-ésima coluna por b. A solução 
do sistema linear ax = Db, de n equações a n incógnitas é o vetor 
x = (x1,...,Xn) cujas coordenadas são 


det ali;b] 
deta 


i=— 


— 
- 
- 
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Com efeito, se a = [v3,...,vn], à igualdade ax = Db significa que 
b=xivi +: + Xnvn. Assim, para cada i de 1 atén, tem-se 


det ali;b] = detlvs,...,D,...,Vn] 
n 
= > x detlvi,...,Vk...,Yn] 
k=1 


= % + detlvi;= 0.4 Val 
=—x;- det a. 


pois, quando k < 1, a matriz [vy,...,Vk,...,Vnl, com v, na i-ésima 
coluna, tem duas colunas iguais a v,., logo seu determinante é zero. 
Segue-se então que x; = det ali; b]/det a. 

Se a e a são matrizes do mesmo operador A em relação a bases 
diferentes então a = p 'ap, onde p é a matriz de passagem de uma 
base para a outra. Portanto 


det a' = (det p) !. det a-det p= det a. 
O teorema seguinte completa esta observação, mostrando que o 
determinante de todas essas matrizes é igual a det A. 


Teorema 19.7. O determinante do operador linear A: E > E é igual 
ao determinante de uma matriz de A numa base qualquer de E. 


Demonstração: Seja a — la;] e M(n xn) a matriz de À numa 
base YU c E. Por definição, det a = det A,, onde Aç:Rº" DRºéo 
operador cuja matriz na base canônica de R" é a. Seja q: E 5 R? 
o isomorfismo que transforma YU na base canônica de R”. Para cada 
u; EU, tem-se Au; — > , ajui, logo 


p(Au)=>3 agplu)=> age; = Ave; = Aop(u;). 
i i 
Segue-se que p-A = A, -p,ouseja, A, = P-A-q”!. Portanto, para 
cada f e An(R”) tem-se 


deta-f=Aif= (q)! Atp*t= (q!) det A-q!t= 
= det A-(q!)! q!f = det A -f. 














Assim, det a = det A. 
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Tradicionalmente, o determinante de uma matriz a = [ai] e 
M(n x n) é definido como a soma de n! parcelas do tipo 





+01; 02; *** Qnjn- 

Essas parcelas são produtos de n fatores que pertencem a linhas 
e colunas diferentes de a. A ordem em que os fatores são dispostos 
é a ordem crescente dos índices 1,2,...,n das linhas. Os segundos 
índices (das colunas) exibem uma permutação o = (jy,...,jn) dos 
inteiros 1,2,...,n. O sinal que precede cada parcela é + ou —, 
conforme a permutação o seja par ou ímpar respectivamente. Nou- 
tras palavras, a definição clássica do determinante é 


det a = Do Es * Qo(1) * U20(2) * +++" Ano(n)» 
o 
o somatório sendo estendido a todas as permutações o dos inteiros 
1,2,...,n,começ=]Isecéparees=-—1I seo é ímpar. 

Para obter esta expressão, consideremos mais uma vez a forma 
fo € An(R”) tal que fo(er,...,en) = 1, logo fo(es(1) +.» Eo(n)) = £o 
para toda permutação o dos inteiros 1,2,...,n. 

Dada a matriz a = [a;] = [v1,...,vnl € M(n x 1), temos 


n 
VI = > Ui1€ij> 


sl 


n 
V2 = > Qi,2€i,, 


=] 


n 
Vn — > Qinnêin» 


in=] 
logo 


det a = fo(vi,...,Vn) 


n n n 
== fo ) Qi,1€% ) Qij2€i,,- ++» ) dinnêin 


Ti = iai 
n 
= ) BA Dea aro Lol Cs Co casi 


Usina] 
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Neste último somatório, são nulas as parcelas em que há repeti- 
ções entre os índices à, iz,..., im, restando apenas aquelas em que 


(bt La agr | = (o(1), PAZ), esa Pl) 


é uma permutação dos inteiros 1,2,...,n. Neste caso, 
Qij1: Qi,2*...º din — Qio(1) * U20(2) * +++" Ano(n), 
deco =p”! ] dente é igual 
onde oc = p 'ea parcela correspondente é igual a 


iii o Se Erg dol Coroas Cata 


Por conseguinte, levando em conta que eg = €£p, tem-se: 
det a = rã EclIo(1) * 202) * +++" Anon)» (*) 
o 


o somatório sendo estendido a todas as permutações o dos intei- 
ros 1,2,...,n. 
Voltando à expressão anterior (*), podemos escrever 


deta= a Epdo(1)1* do(2)2 ++: dom 
p 


Esta igualdade mostra que o determinante da matriz a é igual 
ao determinante da sua transposta a”. 

Se A: E > E é um operador num espaço vetorial munido de pro- 
duto interno e a é sua matriz numa base ortonormal então 


det A=deta=deta! =det A*. 


Resulta da igualdade deta = deta! que o determinante é 
uma função n-linear alternada das linhas da matriz a e M(n x nn). 
(A única tal que det 1, = 1.) Como no caso de colunas, uma qual- 
quer função n-linear alternada f das linhas da matriz a é da forma 
f(a) = c- det a, onde c = f(Ln) = f(ey,..., en). 

Outra consequência da igualdade det A = det A* é que o deter- 
minante de um operador ortogonal À é igual a +1, pois 





(det A)? = det A*. det A = det(A*A) = det I = 11. 
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O teorema seguinte utiliza, em sua demonstração, a caracteriza- 
ção do determinante de uma matriz como função multilinear alter- 
nada das linhas ou das colunas dessa matriz. 


Teorema 19.8. Seb e M(rxr), ce M(rx (n—r)),0€ M((n—r) xr) 
edeM((n—r)x (n—r)) então o determinante da matriz 





a= 9 á e M(nxn) 


é igual a det b - det d. 


Demonstração: Para cada c fixa, 


f(b, d) = det E ã 


0 d 


é uma função r-linear alternada das colunas de b e (n — r)-linear 
alternada das linhas de d, logo 


b c 
det K ] = detb-f(I,,d) 
= det b-det d-f(L,,L,.,) 


= det b-det d, 
pois 


= I, c = 
f(L,;, 11) = det E a =1, 


já que o determinante de uma matriz triangular é o produto dos 
elementos da sua diagonal. 














O Teorema 19.8 implica imediatamente uma sua versão mais ge- 
ral, onde se tem uma matriz triangular por blocos, por exemplo, do 
tipo 

b c d 
a= e fÍ 
8 


Aí, b, e, g são matrizes quadradas (de ordens possivelmente diferen- 
tes) e b, c, d têm o mesmo número de linhas, assim como e, f. Além 
disso, d, f, g têm o mesmo número de colunas, assim como c, e. Os 
lugares em branco são ocupados por zeros. 
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Nestas condições, det a = det b - det e - det g. 

Dada a — [a;] e M(n x n), indicaremos com a notação Mi; 
a matriz de ordem (n — 1) x (n — 1) obtida mediante a omissão 
da i-ésima linha e da j-ésima coluna da matriz a. O ij-ésimo me- 
nor de a é, por definição, o determinante det M;; o qual se chama 
também o menor relativo ao elemento ai. 

Resulta imediatamente do Teorema 19.8 que se a = [ey,vz,..., 
vn! é uma matriz cuja primeira coluna é (1,0,...,0) então det a = 
det M,,. Segue-se que se a = [e;,v2,...,Vn|] então 


det a = (—1)! det My = (—1)*! det My 


pois este caso se reduz ao anterior mediante i — 1 transposições de 
linhas. Portanto, dada a = [a;] = [v1,...,Vn], com 


Vi >. Gê, 
i 


tem-se 
det a = >. ai detle;, v>,...,Vn], 
1 
logo 
deta=3 (—1)*! an det My. 
1 
A fórmula acima, chamada o desenvolvimento de det a segundo 
a primeira coluna, reduz o cálculo do determinante de sua matriz 
n xn ao den determinantes de matrizes (Nn— 1) x (n — 1). 
Mais geralmente, podemos fixar um inteiro arbitrário j, com 
1<j5<n, e efetuar o desenvolvimento do determinante de a se- 
gundo a j-ésima coluna. Para isso, observamos que se 


a— [Wi 5284 jaja Capes 


é uma matriz cuja j-ésima coluna é e; então det a = (—1)' det Mi, 
pois a pode ser transformada numa matriz cuja primeira coluna é e; 
mediante i— 1 transposições de linha e j — 1 transposições de coluna, 
o que provoca i +j — 2 mudanças de sinal em seu determinante, e 
isto é o mesmo que multiplicá-lo por (—1)'%. 

Assim, dada a = [v;,..., vn], com 


Vi = ) Uij&i, 
i 
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temos 
det a = a Qi detlv;, ces VP EV, sVn], 
i 


o que fornece: 
n 


det a — Do ia Qi; det M; E 


i=] 


Este é o desenvolvimento do determinante de a segundo a j-ésima 
coluna. 

Como o determinante de a é igual ao de sua transposta a!, vale 
uma fórmula análoga, que é o desenvolvimento segundo a i-ésima 


linha: 


deta=>3 (—1)' a; det M;. (*) 
j=1 


Estas fórmulas são úteis nos cálculos, principalmente quando se 
escolhe uma linha ou uma coluna com diversos elementos iguais a 
zero. Elas também podem ser usadas como ponto de partida para 
uma definição indutiva do determinante de uma matriz. 

Resulta da fórmula (*) que, para quaisquer 1,j = 1,...,n, temos 


(1) ax det My = (det a) - 6, (8) 


Pe 


m 
Il 


1 


ou seja, este somatório, é igual a det a quando i = j e igual a zero 
quando i < j. Com efeito, o caso i = j é simplesmente a fórmula 
(*) e, para i < j, o somatório acima é o desenvolvimento, segundo a 
j-ésima linha, do determinante de uma matriz a na qual as linhas i 
e j são iguais, portanto seu determinante é zero. 

O primeiro membro da igualdade (**) lembra um produto de 
matrizes. De fato, podemos introduzir uma matriz adja, cha- 
mada a adjunta clássica de a, pondo, para i,j = 1,...,n, (adja); = 
(—1)' det M;. Então o primeiro membro da igualdade (**) é o ij- 
ésimo elemento do produto a - adj a, enquanto o segundo membro é 
o ij-ésimo elemento da matriz (det a).Ihn. Portanto, a igualdade (**) 
significa que 

a- adja= (deta)-L,. 
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Segue-se daí que se a matriz a é invertível (isto é, se deta Z 0) 
então sua inversa se exprime como 
= 


= adja. 


Esta fórmula para a ! também pode ser obtida com auxílio da 
Regra de Cramer. Com efeito, o problema de obter uma matriz a! = 
w,...,Wn] talque aa”! = I, pode ser considerado como n sistemas 
de equações lineares a-w; — e; (; = 1,...,n). Pela Regra de Cramer, 
a solução w; — (x1;,..., Xnj) de cada um desses sistemas é dada por 

det ali;e;] 


j=—ta (IM det Mi, 





pois ali; e;] = [v1,...,Vi-1, Cp Vire os Val se a= [vi,..., Val. 
Uma submatriz da matriz a e M(m x n) é uma matriz obtida a 
partir de a pela omissão de algumas de suas linhas e/ou colunas. 
Mais precisamente, dois subconjuntos 


R=(à<-<u)cil,2..om) 


S=i<<j)cll,2,..on) 


determinam a submatriz ars = lai,j;l € M(r xs) da matriz a, obtida 
pela omissão das linhas de a cujos índices não pertencem a R e das 
colunas cujos índices não estão em S. 


Teorema 19.9. O posto de uma matriz a e M(m x n) é o maior 
número r tal que a possui uma submatriz aps E M(r x 7), com 
det ARS 0. 


Demonstração: Seja r o posto de a = [v3,...,Vnl. Existe S = [jj < 
e <jj Cc (1,2,...,n)tal que (v;,...,v;) é LI. portanto a matriz 
[vo +++ Vi] € M(m x 7) tem posto r. Como o posto segundo linhas é 
igual ao posto segundo colunas (Teorema 8.2), existe um subconjunto 
R=(y<:<ijc(l,2,...,mtalque as linhas de [v;,...,v;] cujos 
índices pertencem a R são L.l.. Isto significa que a matriz quadrada 
ars € M(r x 7) é invertível, logo det aps 2 O. Mas é claro que o 
posto de uma submatriz de a é menor do que ou igual ao posto de 
a. Portanto, nenhuma submatriz k x k de a, com k > r, pode ter 
determinante Z 0. 
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Na Seção 17 (vide Observação no final de 17.G) foi provado que 
uma matriz simétrica é positiva se, e somente se, seus pivôs são 
todos positivos. Usaremos agora determinantes para provar outro 
critério de positividade de uma matriz, o qual é tradicional e ele- 
gante porém em dimensões mais altas é muito menos prático do que 
o teste dos pivôs. 

Para cada k = 1,...,n o menor principal de ordem k da matriz 
a = [a;]le M(n xn) é o determinante da submatriz principal a, = 
la;],1<ij<k. 


Teorema 19.10. A fim de que uma matriz simétrica a = la] € 
M(m x n) seja positiva é necessário e suficiente que seus menores 
principais sejam todos positivos. 


Demonstração: No início de 17.G. viu-se que se a é positiva então 
suas submatrizes principais a, são positivas, logo det a, > O para 
k = 1,...,n. Suponha, reciprocamente, que todos os menores prin- 
cipais sejam positivos. Tomando a decomposição a = lu (veja item 
5ºem 17.F), resulta que a, = lu, para k = 1,...,n, lx e uy indicam 
as submatrizes principais k x k de le u respectivamente. Segue-se 
do Exemplo 19.5 que det 1, = 1, pois todos os elementos da diagonal 
de 1, são iguais a 1. Logo det a, = det(l uy) = det u, = Uj1U22...Ukk 
(produto dos elementos da diagonal de u,). Portanto u1 = det a, > 
O eu; = deta,/det a. 1 > 0Oparak =2,...,n. Assim todos os pivôs 
uk da decomposição a = lu são positivos, logo a matriz simétrica a 
é positiva. 














Apêndice 
Uma permutação dos inteiros 1,2,...,n é uma bijeção 0: Jn > Jn, 
onde Jn = (1,2,...,n). Um exemplo particular de permutação, quan- 


don > 1, é dado pelas transposições. Uma transposição T: Ja > Jn 
é definida fixando-se dois elementos i < j em Jn, pondo T(i) = 5, 
T(j)=iert(k)=ksek g(i,j). 

Se 0,0": Jh — Jn são permutações então a função composta o o 
o: Jn — )Jn também é uma permutação, chamada o produto das 
permutações o e o! e indicada pela notação 00”. Ainversa o !: Jp — 
Jn de uma permutação é ainda uma permutação, caracterizada pelo 
fato de que co! — o lo — ww — permutação identidade Jn — Jn. Se 
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T é uma transposição então TT = W, OU seja, T=T!. 


Às vezes se representa uma permutação o: Jn — Jn pela lista 


ordenada (o(1),...,oc(n)) dos valores que ela assume nos números 
1,2, e ea Tl; 
O conjunto das permutações dos n números 1,2,...,n tem 


n!=1.2...n elementos. 


Toda permutação o: Jn — Jn se escreve (de várias maneiras dife- 
rentes) como produto de transposições 0 = Tj : T2...Tk. 


Dada a permutação o, o número k de transposições tais que 
O = Tj:T)...T, pode variar, porém não a sua paridade. Noutras 
palavras, se o puder ser expressa como produto de um número par 
de transposições então não poderá ser expressa como produto de um 
número ímpar de transposições. Ou ainda, seo = Tj-T2...T« onde as 
t; são transposições então (—1)* é um número que depende apenas 
de o. Este número, igual a +1, é representado pela notação ec. 





Quando es = +], diz-se que o é uma permutação par. Se 
£o = —1, diz-se que o é uma permutação ímpar. Tem-se eso! = Eo Ego”, 
ou seja, o produto de permutações pares é par, o produto de uma 
permutação par por uma permutação ímpar é ímpar e o produto de 
duas permutações ímpares é par. É claro também que es = Ega. 


Exercícios 

19.1. Sejam E;,..., E, espaços vetoriais de dimensões ny,...,ny res- 
pectivamente. Defina função r-linear f: E; x ---x E; > Re prove 
que o conjunto £(E1,..., E;;R) dessas funções é um espaço vetorial 
de dimensão ny -n2-...-m4. 

19.2. Sejam E um espaço vetorial de dimensão neU = (m,...,Un) E 


E uma base. Para cada segiiência crescente ]=(jy; <jz<---<jrj de 
r inteiros de 1 até n, seja escolhido um número ay. Prove que existe 
uma (única) forma r-linear alternada f: E x... x E > R tal que 
f(u;,,...,U;,) — ay para toda sequência J] — (jy < --- < j;). Conclua 
que o espaço vetorial A,(E) tem dimensão igual a (7). 
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19.3. Dados os funcionais lineares f,,...,f;: E > R, defina a forma 
r-linear alternada f = 14A...Nf,: Ex---xE > R pondo f(vi,...,vr) = 
det(f;(v;)). (“Produto exterior” dos funcionais fj,...,f;.) Prove que 
fiA...Af; £0 se, e somente se, fj,...,f, são L.I.. Prove também 
que se [fj,...,fn) C E* é uma base então as formas fj — f;, A...Nfj, 
paratodo J=(jj<---<j)C(1,2,...,n), constituem uma base para 


AE). 


19.4. Chama-se gramiano dos vetores v1,v2,...,Vvk € R” ao número 
v(vi, “e +Vk) E det((vi, v;)), 
determinante da matriz de Gram g(vi,...,Vk). Prove: 


(a) y(vi,...,Vvk) > O se, e somente se, os vetores vj,...,vk são line- 
armente independentes. 


(b) Se v; é perpendicular a v>,...,v. então y(vi,.. vi) = Mm): 
v(v>, .. 3 Vk)e 


19.5. Com a notação do exercício anterior, sejam w; a projeção or- 
togonal do vetor v; sobre o subespaço gerado por vz,...,vr e hy = 
vi — Wr, logo hy é perpendicular aos v; com 2 < j <r. Prove que 
viva, .. »Vr) = IhiBy(va, ... 3 Vr). 


19.6. O paralelepípedo gerado pelos vetores linearmente indepen- 
dentes v,,...,vr E R? é o conjunto Plv;,...,vr;] das combinações line- 
ares tyvi + ---+tryv,, onde O < t; < 1. O volume (r-dimensional) do 
paralelepípedo é definido por indução. Se r = 1, ele se reduz ao seg- 
mento de reta [0, vi], cujo “volume” uni-dimensional é, por definição, 
[vil. Supondo definido o volume de um paralelepípedo de dimensão 
r— 1, põe-se 


vol Plvy,...,vl = Ihy|-volPlva,..., vi], 
onde |h;| é a altura do paralelepípedo, isto é, h = v —w, ew é 


a projeção ortogonal de v; sobre o subespaço gerado por v2,...,Vr. 
Prove que 


vol Plvi,...,vr] = VY(vi,.. Vi) = det((vi v;)). 
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19.7. Seja a a matriz quadrada invertível cujas colunas são os veto- 


res v1,...,Vn E R”. Prove que y(v1,...,vn) = (det a)? e conclua que 
o paralelepípedo gerado pelos vetores v;,...,vn tem volume igual a 
|det al. 


19.8. Seja A:R” — R” um operador linear invertível. Para todo 
paralelepípedo n-dimensional X c R”, prove que a imagem A(X) é 
um paralelepípedo tal que vol A(X) = | det A|- volX. 


19.9. Calcule o determinante da matriz 


0 Õ O am 
O O as ax 
O a az ax 
041 42 43 44 


e generalize o resultado para uma matriz [a;] e M(n x n) na qual 
ai; — O quando i +j <n. 


19.10. Se a matriz triangular b resulta de a pelo processo gaussi- 
ano de eliminação, prove que det b = (—1)! det a, onde t é o número 
de transposições de linhas feitas durante o escalonamento. (Esca- 
lonamento é o modo mais eficaz de calcular o determinante de uma 
matriz n xn quandon > 4.) 


19.11. Escalonando a matriz de Vandermonde 


1 1 de cade À 


X1 X2 X3 gar Xn 

2 2 2 2 

v= | x xá da ve Mi 
n—1 n— n—1 a 

E x, X3 ... Xn 


mostre que seu determinante é igual a 


E (x =) 
logo v é invertível se, e somente se, os números x1, x2,...,Xn são dois 
a dois distintos. Como aplicação, mostre que, dados n + 1 pares de 
números (xo, Yo), ., (Xn,Un), onde xo<xj<--: <Xn, existe um, e so- 
mente um, polinômio p de grau <n tal que p(xo)=yo,...,P(Xn)=Un.- 
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19.12. Use eliminação gaussiana (escalonamento) para calcular os 
determinantes das seguintes matrizes: 


ed fo si > aê 
So =p d ST. 
ST =» é E = 4 3 
É 3 =6 À 2 dd 4 


19.13. Proponha e resolva um sistema linear com o uso da regra 
de Cramer e calcule pelo menos a inversa de uma matriz usando a 
adjunta clássica. 


19.14. Calcule os determinantes das matrizes 


a 1+b Cc e 


a b T+c 


I+a b Cc 
R 0 


0 g| 


onde os zeros representam matrizes de dimensões adequadas. 


19.15. Analise o seguinte argumento segundo o qual toda matriz 


anti-simétrica tem determinante igual a zero: “Tem-se a! = -a, 
logo det a = det a! = det(—-a) = — det a, logo det a = 0.” Contraste 
com 
0 — 
det É 0 | ; 

19.16. Defina o produto vetorial de n vetores vi,...,vn E RM! 
como o vetor v = vi X--: x vn tal que, para todo w E R'*!, tem- 
se (w,v) = detlv;,...,Vn, W] = determinante da matriz cujas colunas 
são os vetores vj,...,Vn,W nesta ordem. Prove: 


(a) O vetorv = vi; x--: x vn € R?t está bem definido e é uma 
função n-linear alternada dos vetores vj,...,Vn.- 


(b) Seja a = [vs,...,Vnl a matriz (n + 1) x mn cujas colunas são 
vi,-.Vn. Paracadai=1,...,n+], sejjaa; e M(nxn) amatriz 
obtida de a pela omissão da i-ésima linha. Prove que a i-ésima 
coordenada do vetor v = v; x--- x vn é iguala (—] MH det a;. 


(c) O produto vetorial v = v; x ---: x vn é ortogonal a vy,...,Vn. 
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(d) Tem-sev =v x---xvn = 0 se, e somente se, v1,...,Vn são L.D.. 


(e) Quando v < 0, a norma |v| = |v; x --- x vn| é igual ao volume do 


paralelepípedo n-dimensional P[vs,...,vn] C RM. 
[Sugestão: calcule vol Plv, vy,...,Vnl], levando em conta (c).) 

(f) Quando os vetores vi,...,Vn são L.I., tem-se detlvi,...,Vn, VI X 
se 3 Va] > O, 


(g) O produto vetorial v = v; x --- x vn é 0 único vetor de R"*! com 
as propriedades (c), (d), (e), (f) acima. 


19.17. Para cadai = 1,...,n +], seja a e M(n xn) a matriz obtida 
omitindo a i-ésima linha de a e M((n + 1) xn). Prove que 


n+ 
det(a'a) = > (det a;)?. (Identidade de Lagrange.) 
i= 
[Sugestão: use (e) acima e o Exercício 19.6.] 


19.18. Prove que todo operador ortogonal com determinante positivo 
possui uma raiz quadrada ortogonal. Ela é única? 


20 


O Polinômio Característico 


Boa parte da importância dos determinantes em Álgebra Linear se 
deve ao polinômio característico, o qual já tivemos ocasião de utilizar 
em dimensão 2. Nesta seção, já de posse da noção geral de determi- 
nante, vamos considerar esse polinômio em dimensões arbitrárias. 


Seja A: E — E um operador linear num espaço vetorial E, de 
dimensão finita. A fim de que um número real À seja autovalor de À, 
é necessário e suficiente que exista v Z 0 em E tal que (A —AI)v =0, 
ou seja, que o operador À — AI: E > E tenha núcleo não-trivial e 
portanto não seja invertível. Segundo o Teorema 19.6, isto acontece 
se, e somente se, det(A — AI) — 0. 

Conforme resulta da definição clássica de determinante, 
det(A-—AI) é um polinômio de graun em, cujo termo líder é (— 1)" A”. 
Ele é chamado o polinômio característico do operador À e é represen- 
tado por pa (A). Assim, 


pa(A) = det(A — AI). 


As raízes (reais ou complexas) da equação algébrica pa(A) = O são 
chamadas as raízes características do operador A. Do que foi dito 
acima, segue-se que os autovalores do operador linear A são suas 
raízes características reais. 
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Se E possui produto interno, o polinômio característico do opera- 
dor adjunto A*: E — E coincide com o do operador À pois 


pa-(A) = det(A* — AI) = det(A — AI)* = det(A — AI) = pa(A). 


O polinômio característico de uma matriz quadrada a E M(nxn) 
é, por definição, pa(A) = det(a — AL), ou seja, é o polinômio carac- 
terístico pa (A) do operador A: R”" — R” cuja matriz na base canônica 
é igual a a. Mais geralmente, pa(A) = pa(A) para qualquer operador 
linear A: E > E cuja matriz, relativamente a uma base arbitrária 
de E, seja a. (Vide Teorema 19.7.) 

Se duas matrizes a eb = p !ap são semelhantes então seus 
polinômios característicos são iguais. Com efeito, neste caso, a e 
b são matrizes do mesmo operador A: R”" — R? relativamente a 
bases diferentes, logo pa(A) = pa(A) = pp(A). Analogamente, se À e 
B — P-!AP são operadores semelhantes no espaço vetorial E, existem 
duas bases de E relativamente às quais À e B têm a mesma matriz 
a, logo pa(A) = pa(A) = pe(A). 

Exemplo 20.1. Se um dos operadores A,B: E — E (digamos, B) 
é invertível então paB(A) = pea(A). Com efeito, neste caso, BA =— 
B(AB)B”!, logo BA e AB são operadores semelhantes. A igualdade 
entre os polinômios característicos de AB e BA prevalece, mesmo 
quando ambos os operadores, À e B, são não-invertíveis. Isto se 
prova usando um argumento de continuidade, assim: como o opera- 
dor B tem no máximo um número finito de autovalores positivos, 
existe um número real c > O tal que O < e < c>B-clin- 
vertível. Portanto, para todo £ positivo, menor do que c, os opera- 
dores (B — eDA e A(B — cl) têm o mesmo polinômio característico. 
Como os coeficientes do polinômio característico do operador B — el 
são evidentemente funções contínuas de £, fazendo e — O concluímos 
que 

pas = lim pa(B-<1) = lim p(p-ena = PBA- 
E50 E0 


Exemplo 20.2. Um operador A: ESE diz-se triangularizável quan- 
do existe uma base 4 de E em relação à qual a matriz de À é trian- 
gular. Se a matriz de À na base YU = (w,..., un) é triangular inferior 
então, na base U' = (un,...,uj), a matriz de À é triangular superior. 
Isto significa que existem subespaços F; CH C---cF =Ein- 
variantes por À, tais que dim F;, = à. Se À é triangularizável e, na 
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base 4, sua matriz a = [ai] é triangular superior então o polinômio 
característico de À é 


n 


pA(A) = | [la —A). 


i=] 


Com efeito, a matriz de A — AI na base 4 também é triangular su- 
perior, com os elementos a; — À na diagonal, logo seu determinante 
é igual ao produto desses números. (Exemplo 19.5.) Portanto, as 
raízes características de um operador triangularizável são todas re- 
ais, logo são autovalores desse operador. Em particular, são reais 
as raízes do polinômio característico de uma matriz simétrica (ou, o 
que é o mesmo, de um operador auto-adjunto num espaço com pro- 
duto interno) pois toda matriz simétrica é semelhante a uma matriz 
diagonal, que é certamente triangular. 

A noção de polinômio característico permite concluir que se a 
dimensão de E é um número ímpar então todo operador linear 
A: E > E possui pelo menos um autovalor. Com efeito, o polinômio 
característico pa (À), sendo um polinômio real de grau ímpar, possui 
pelo menos uma raiz real. 

Quando dim E = 2, sabemos que o polinômio característico do 
operador A: Rº? > R?, cuja matriz na base canônica tem linhas (a,b) 
e (c,d), é igual a 

Ne=(ardAsod=be, 


onde o coeficiente de À é menos a soma a + d dos elementos da diago- 
nal dessa matriz e o termo constante, ad — bc, é seu determinante. 

Em que pese a importância dos autovalores de A, é uma tarefa 
complicada a determinação dos coeficientes de pa quando seu grau 
é elevado (e muito mais complicado ainda o cálculo de suas raízes). 
Um desses coeficientes é, entretanto, fácil de calcular: o termo inde- 
pendente de À é igual a pa(0), logo é igual a det A. 

Por outro lado, se as raízes de pa são Aj,..., An, tem-se 


PA(M) = (DMA >A): (A An). 


Pondo À = O vem det À = pa(0) = A ---:- A. Portanto o determi- 
nante de À é igual ao produto das suas raízes características, mesmo 
quando algumas delas são números complexos. (Como pa é um po- 
linômio real, suas raízes complexas, caso existam, vêm aos pares 
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conjugados, « +if e «— if, com produto «? + 2, logo o produto das 
raízes de pa é real.) 

Outro termo de fácil determinação no polinômio pa(A) é o coe- 
ficiente de A!. Na expressão clássica de det(A — AI) em termos 
da matriz a — [a;;] de A numa certa base, as parcelas que contém 
a potência A! resultam do produto Tai; — A) dos termos da dia- 
gonal de a — AL,, logo são todas da forma (—1)"-!a;A"-!. Portanto 
(=! > a; é o coeficiente de A"! no polinômio pa (A). 


Novamente, a expressão 


mostra que o coeficiente de A"! é igual a (—1)"-! vezes a soma das 
raízes do polinômio pa. 

Isto nos leva a concluir que, seja qual for a base escolhida em E, 
a soma Xa;; dos elementos da diagonal da matriz de À nessa base é 
a mesma, igual à soma das raízes características de A, que é sempre 
um número real (mesmo que haja raízes complexas) pois (a + 1/3) + 
(x —iB) = 2x. 

Esta soma ai; chama-se o traço do operador A e é designada 
com a notação tr A. 


Segue-se do Exemplo 20.1 que tr AB = tr BA sejam quais forem 
os operadores lineares A, B: E > E. (Isto também se vê diretamente, 
multiplicando as matrizes de À e B.) 

Com esta notação, quando dim E = 2 0 polinômio característico 
de um operador A: E > E se escreve pa(A) = A2— (tr AJA+ det A. 

Vimos no Exemplo 20.2 que as raízes características de um ope- 
rador triangularizável são todas números reais. Mostraremos agora 
que vale a recíproca. 


Para isso, faremos uso do seguinte 


Lema. Seja F c E um subespaço invariante pelo operador A: E 5 E. 
Se A':F — F representa a restrição de A ao subespaço F, então o 
polinômio pa: é um divisor de pa. 
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Demonstração: Sejam a” a matriz de A numa basel' CFeaa 
matriz de A numa base YU DU”. Então 


a b a -AL b 
a= e a-—Al, = 5 
0 c 0 c—- AM 


onde r = dim Fen = dim E. Pelo Teorema 19.8, temos 


pa(A) = det(a — AL, ) 
— det(a' — AL,) - det(c — AL...) 
= PA'(A) E q(A), 


onde 
q(A) = det(c — Ali). 











Portanto pa (À) é um múltiplo de par(A). 





Teorema 20.1. Se as raízes do polinômio característico pa são todas 
reais então o operador A: E > E é triangularizável. 


Demonstração: O teorema é óbvio se dim E = 1. Para prová-lo 
por indução, suponhamo-lo válido em dimensão n — 1 e seja dim E = 
n. Introduzamos (caso não exista ainda) um produto interno em 
E. Como A e A* têm o mesmo polinômio característico, o operador 
A*: E > E tem autovalor logo existe um subespaço F € E, de di- 
mensão 1, invariante por A*. O complemento ortogonal F* = F,.1 
é um subespaço vetorial de dimensão n — 1 em E, invariante por A, 
pois A = (A*)*. (Vide Teorema 13.3.) Pelo Lema, se AÀ': Fr 1 > Fr 
é a restrição de A ao subespaço F, 1, as raízes do polinômio carac- 
terístico pa: são também raízes de pa, logo são todas reais. Pela 
hipótese de indução, existem subespaços F; CF C --- € F,.1, com 
dim F; =, invariantes por A”, logo invariantes por A, o que prova o 
teorema. 

















Exemplo 20.3. Um operador num espaço vetorial de dimensão 
2 é triangularizável se, e somente se, possui ao menos um auto- 
valor real. Por exemplo, uma rotação de ângulo 0, com O £ 0 e 
9 £ 180º, não é triangularizável pois suas raízes características são 
cos 9+isen 0, ambas complexas. (Vide Exemplo 14.2.) Já o operador 
A:R? > Rº, A(x,y) = (7x—12y,3x—5y), tem polinômio característico 
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pa(A) = A? — 2A + 1 com uma raiz real dupla À — 1, logo A é trian- 
gularizável. Evidentemente, A não é diagonalizável pois se o fosse, 
como seu único autovalor é 1, seria igual ao operador identidade. Se 
quisermos achar uma base (u,v) € R? na qual a matriz de A seja 
triangular superior, basta procurar um autovetor u = (x,y), com 
Au =u, ou seja, basta achar uma solução não-trivial u = (x,y) do 
sistema 7x — 12y = x, 3x — 5y = y. Uma dessas soluções é u = (2,1). 
Tomando, por exemplo, v = (0,1), a matriz de A na base (u, v) é 
o E . Comefeito, Au- ue Av-=-—6u+v. 

Exemplo 20.4. Seja A: Rê — Rº a rotação de ângulo 6 em torno do 
eixo z. Temos, para todo (x,y,z) € Rº: 


Alx,y,Z) = (xcos O —ysen 9,xsen O +ycos 0,z). 


Para evitar casos especiais óbvios, suponhamos O < O < 180º. Cha- 
mando de a a matriz de A na base canônica de Rº, a matriz de A—AI 
é 





cos0—-A —sen 60 0 
a— A; = sen O cos0-AÀ 0 
O) O) 1-A 


logo det(A —- AI) = (1-A)(Xº— 2A cos 0 + 1) = pa(A). 

Portanto o polinômio característico p, tem uma raiz real 1 e duas 
raízes complexas cos O +isen 0. Assim, não existe em Rº uma base 
na qual a matriz de À seja triangular. 

Examinando a demonstração do Teorema 20.1 vemos que, se o 
espaço E vem provido de um produto interno, ela fornece uma base 
ortonormal em relação à qual a matriz do operador A: E > E (cujo 
polinômio característico tem apenas raízes reais) é uma matriz tri- 
angular. Isto fornece a seguinte interpretação matricial para aquele 
teorema: se o polinômio característico da matriza e M(n xn) é um 
produto de fatores reais do primeiro grau então existe uma matriz 
ortogonal q e M(n x n) tal quet = q'aq (= q !'aq) é uma matriz 
triangular. 

Dados um operador linear A: E — E e um polinômio 





P(A) = ao +aÃ+: + ama”, 
o símbolo p(A) representará o operador 


p(A)=aol+aÃ+---+amA”, 
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obtido de p(A) substituindo-se X' por A!, tendo o cuidado de lembrar 
que Aº = 1, logo Àº = 1 deve ser substituído por 1. 

Um resultado importante em Álgebra Linear é o Teorema de 
Cayley-Hamilton, segundo o qual, se p = pa é o polinômio carac- 
terístico do operador A então p(A) = 0. Verifiquemos a veracidade 
desta afirmação num caso particular. 


Exemplo 20.5. Seja A: R? — Rº dado por 
Alx,y) = (ax + by, cx + dy). 


O polinômio característico de À é 





Vamos mostrar que o operador 





B=-pa(A)=A?-—(a+d)A+ (ad -—bc)l 


é igual a zero. Para isto, basta verificar que Be; = Be, = O. Ora, 
temos Ae, = (a,c), Ae, = (a? + bc,ac + cd), e, = (1,0), logo 





Be; = A?e; — (a + d)Ae; + (ad — bc)e; 
= (a? +bc,ac+cd) — (a? + ad,ac + cd) + (ad — bc,0) 
= (0,0). 


De maneira análoga se vê que Be; = O. Portanto B = 0. Isto mostra 
que o Teorema de Cayley-Hamilton vale em dimensão 2. 

Provaremos, a seguir, o Teorema de Cayley-Hamilton para ope- 
radores triangularizáveis. Na próxima seção mostraremos que, num 
espaço vetorial complexo, todo operador é triangularizável. Daí de- 
duziremos a validez do teorema para qualquer operador num espaço 
real. 


Teorema 20.2. Se o polinômio característico pa do operador 
A: ESEéo produto de fatores reais do primeiro grau então pa(A)=0. 


Demonstração: Pelo Teorema 20.1 existe uma base (u,...,un) EC E 
relativamente à qual a matriz a — [a;] de À é triangular superior. 
Se escrevermos E; = (0) e F; = subespaço vetorial de E gerado por 
w1,...,Ui, teremos F; CH C---. cr = Ee cada F; é invariante 
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por A, ou seja, A(F;) C F;. Por hipótese, temos pa(A) = (—1)P(A — 
AM)... (A— A). Escrevendo B = pa (A), resulta: 

B=(-1)P(A — anT(A — azx0)---(A — amd) 


pois as raízes características de A são os elementos a;; da diagonal 


da matriz a. Para cada à = 1,...,n, temos Au; = z + a;jui;, onde 
z E F 1, portanto (A — a;lju, = z € F; 4. Isto mostra que, para todo 
i=1,...,n, o operador B; = À — ail transforma F; em F; 4. Ora, 


temos pa(A) = B = BjB,...B,, logo 


Bn 


E A 





s Fo = (0) 


B=palA) 











pa(A) transforma E em (0), isto é, pa(A) = 0. 





Seja A, um autovalor do operador A: E > E. A multiplicidade 
geométrica de A, é a dimensão do subespaço vetorial h, = (v € 
E; Av = Aov). A multiplicidade algébrica de À, é sua multiplicidade 
como raiz do polinômio característico de A, isto é, é o maior inteiro 
m tal que pa(A) = (Ao — A)”. q(A), onde g(A) é ainda um polinômio. 

Obviamente, H, é um subespaço invariante por A. Restrito a 
esse subespaço, A coincide com Asl, ou seja, é simplesmente a mul- 
tiplicação por Ao. Portanto, o polinômio característico do operador 
A': H, — H,, restrição de A, é igual a (A, — À)”, onde r é a dimensão 
de F,, ou seja, a multiplicidade geométrica do autovalor Ao. Pelo 
Lema que antecede o Teorema 20.1, o polinômio característico de A 
é um múltiplo de (A, —A)”, ou seja, pa(A) = (Ao —AJ)" q(A). Isto prova o 


Teorema 20.3. A multiplicidade geométrica de um autovalor é me- 
nor do que ou igual à sua multiplicidade algébrica. 


Exemplo 20.6. No operador A do Exemplo 20.3, a multiplicidade 
algébrica do autovalor 1 é igual a 2 mas a sua multiplicidade geomé- 
trica é 1. 


Teorema 20.4. Se o operador A: E > E é auto-adjunto, ou ortogo- 
nal, as multiplicidades geométrica e algébrica de qualquer autovalor 
coincidem. 
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Demonstração: Seja F —- H, — (ve EAv = A -v). Então Fe F 
são ambos subespaços invariantes por A. Como vimos no Lema que 
antecede o Teorema 20.1, se indicarmos respectivamente por À': F > 
Fe A”:Fi > F- as restrições de A a esses subespaços invariantes, 
teremos pa = Pa”: PA», ou seja, pa(A) = (A, — À)" - par(A), onde 
r = dim F. Mas, pela definição de F, não pode existir em Fl (nem em 
lugar algum fora de F) um autovetor correspondente ao autovalor A,. 
Logo À, não é raiz de pa». Assim, r é o maior inteiro tal que (A, — A)” 
divide pa, ou seja, é a multiplicidade algébrica de Ao. 














Exercícios 


20.1. Assinale V(erdadeiro) ou F(also): 
( ) Os operadores À e A* têm os mesmos autovetores. 


( ) Sejam a a matriz do operador A: R” — R” na base canônica e 
p uma matriz cujas colunas são autovetores L.l. de A. Então 
pap é diagonal. 


( ) SeA é autovalor do operador invertível A então À! é autovalor 
de A. 


( ) O polinômio característico do operador A + B é a soma dos po- 
linômios característicos de À e B. 


( ) Se v é um autovetor comum aos operadores À e B então v é 
autovetor de A + Be de BA. 


( ) Duas matrizes triangulares semelhantes são iguais. 


20.2. Determine os polinômios característicos dos seguintes opera- 
dores: 


(a) Um múltiplo «al da identidade; 
(b) Uma projeção P; 
(c) Uma involução; 


(d) O operador de derivação D: P, > Ph. 
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20.3. No espaço vetorial E, de dimensão finita, com produto interno, 
seja Av = (v,a) b um operador de posto 1. Escreva a matriz de À 
numa base ortonormal que comece com uw, = a/Jal e, a partir daí, 
determine o polinômio característico de A, seus autovetores e seus 
autovalores com as respectivas multiplicidades. 


20.4. Qual o coeficiente de À? no polinômio característico pa(A) de 
uma matriz a = [a;]e M(3 x 3)? 


20.5. Seja F| c E um subespaço invariante pelo operador linear 
A:ES E SeE=F&É,seja Pa projeção sobre F; paralelamente a 
KH. Indique com Aj: H — F a restrição de À a F, e com Az: E > E 
o operador dado por Azv = PAv, v € E. Prove que pa(A) = pa, (À) - 
pa,(A). Seja U uma base de E, formada por uma base de F seguida 
por outra de F;. Mostre que a matriz de À na base YU tem a forma 


al b 

0 a, 
onde a; e az são as matrizes de A, e Az respectivamente. Dê um 
enunciado mais simples, em termos de matrizes, para a proposição 
cuja tese é pa(A) = pa,(A) - pa,(A). 


20.6. Determine o polinômio característico, ache os autovalores e 
exiba uma base de autovetores para a matriz 


: -3 1 | 
2 — 1 1 
HE DEE 


20.7. Determine o polinômio característico e os autovalores da ma- 


triz 
4 —3 as 4 5 Og 
21 b by bs bg 
0 0 —4 3 C5 C6 


O O ZTd 
od bd Ts 
O O os =] 


20.8. Quais são os autovetores do operador de derivação D: CY(R) > 
CIR) 
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20.9. Assinale V(erdadeiro) ou F(also): 


( ) Se um operador é diagonalizável, todas as suas matrizes trian- 
gulares são diagonais. 


( ) Seja a uma matriz triangular não-diagonal. Se todos os ele- 
mentos da diagonal de a forem iguais, a não é diagonalizável. 


( ) Uma matriz 3 x 3 que tem dois autovalores distintos é triangu- 
larizável. 


20.10. Sejam A,B: E — E operadores cujas raízes características 
são todas reais. Se AB = BA, prove que existe uma base na qual as 
matrizes de À e B são ambas triangulares. 


20.11. Ache uma base de Rº na qual o operador A(x,y,z) = (x +2y + 
3z, 4y + 62, —y — z) tem uma matriz triangular. Exiba essa matriz. 


20.12. Determine o polinômio caracterítico da matriz 


O) 1 O... 0 

O) O) 1 são SO 

O) O) O ee | 
An-—1 An-2 Qn-3 o... do 


20.13. Obtenha o polinômio característico e os autovalores (com as 
respectivas multiplicidades, algébricas e geométricas) do operador 
A:R" > Rº cuja matriz na base canônica tem todos os elementos 
iguais a 1. 

[Sugestão: use o Exercício 20.3.] 


20.14. Prove que o módulo do determinante de um operador in- 
vertível é igual ao produto dos seus valores singulares. 


20.15. Sejam A,B: E — E operadores lineares não-negativos e X a 
raiz quadrada não-negativa de A. Prove: 


(a) AB e XBX têm o mesmo polinômio característico, logo 
det(I + AB) = det(I + XBX). 
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(b) O operador XBX é não-negativo e 


det(1+XBX) =| [(1+A;), 


i=1 
onde A,...,An são os autovalores de XBX. 


(c) Conclua que det(I+ AB) > 1. Em particular, I+ AB é invertível. 


21 


Espaços Vetoriais 
Complexos 


Embora a noção de espaço vetorial tenha sentido (e interesse) sobre 
um corpo qualquer, neste livro os vetores (pelo menos até agora) vêm 
sendo multiplicados apenas por números reais. Esta opção foi feita 
por uma série de razões, das quais destacaremos duas. Em primeiro 
lugar, ao nos limitarmos aos números reais, não temos que nos preo- 
cupar com as peculiaridades dos vários corpos possíveis o que, num 
livro introdutório, traria o risco de focalizar a atenção no acidental. 
Assim ficou mais fácil nos concentrarmos em questões realmente es- 
senciais, sem maior perda de tempo. Em segundo lugar, porque o 
caso real é, sem dúvida, o mais importante. Entretanto, o corpo dos 
números reais não é algebricamente completo: nem todo polinômio 
com coeficientes reais possui raiz real. O corpo dos números comple- 
xos não sofre dessa deficiência. Isto torna necessário que alguns teo- 
remas referentes a espaços vetoriais reais utilizem números comple- 
xos em sua demonstração (como foi feito, um tanto disfarçadamente, 
no Teorema 12.1). Na presente seção, é introduzido o conceito de 
espaço vetorial complexo e é mostrado explicitamente como ele pode 
ser útil para demonstrar teoremas sobre espaços vetoriais reais. 


Nesta seção, os espaços vetoriais que viemos estudando até agora 
serão chamados espaços vetoriais reais e as transformações lineares 
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neles definidas serão chamadas R-lineares. Analogamente, as ma- 
trizes até agora consideradas chamar-se-ão matrizes reais. À razão 
para essa qualificação é que introduziremos aqui os espaços vetori- 
ais complexos. 

Um espaço vetorial complexo é um conjunto E, cujos elementos 
são chamados vetores, no qual estão definidas duas operações: a 
adição, que faz corresponder a cada par de vetores u,v € E um vetor 
u+v, chamado a soma deu ev, e a multiplicação por um número 
complexo, que a cada número complexo ( e a cada vetor v E E faz cor- 
responder um vetor € -v = Cv, chamado o produto de € por v. Essas 
operações devem cumprir as mesmas condições impostas na Seção 1 
para os espaços vetoriais reais. Em particular, seve Ee C= «+ip 
então Cv = «v +HiBv = av + B(iv). 


Exemplo 21.1. O conjunto C” de todas as listas u = (E1,...,En), 
v = (€,...,Cn) de n números complexos, com as definições u+v = 
(+. sEntn), Cu =(lE,...,C- En), é um espaço vetorial 
complexo. Também o conjunto F(X;C) de todas as funções f: X5C, 
definidas num conjunto arbitrário X, com valores complexos, é um 
espaço vetorial complexo quando munido das definições óbvias para 
f+gecl-f. O conjunto M(m x n;C) das matrizes complexas m x n 
também é um espaço vetorial complexo. 

As definições de dependência linear, geradores, subespaço, base, 
dimensão, etc. se fazem para os espaços vetoriais complexos da 
mesma maneira como foram feitas para os reais. Na realidade, tudo 
o que foi dito e demonstrado nas Seções 1 a 9 vale para espaços ve- 
toriais complexos e as transformações lineares entre eles, as quais 
chamaremos C-lineares. 

As vezes, uma base do espaço vetorial complexo E será chamada 
uma C-base. 

Um espaço vetorial complexo E pode, de modo natural, ser consi- 
derado como um espaço vetorial real: basta que se considere apenas 
a multiplicação dos vetores de E por números reais. Analogamente, 
toda transformação C-linear A: E — F entre espaços vetoriais com- 
plexos é, a fortiori, R-linear. Quando for conveniente, usaremos a 
notação A,: E — F para indicar essa transformação R-linear, que se 
chama a descomplexificada de A. 


Exemplo 21.2. O conjunto C dos números complexos é um espaço 
vetorial complexo de dimensão 1, logo todo número complexo 
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«+ifp * O fornece uma base para C. Em particular, (1) é uma C-base. 
Considerando C como espaço vetorial real, o conjunto (1,i) c Cé LI. 
poisa-1+B-1=0,coma,p E R implica « = B = 0. Na realidade, 
(1,1) é uma R-base pois todo número complexo « +HiB =«a-1+B-ié 
uma combinação linear real de 1 e 1. Em virtude da unidimensiona- 
lidade, os operadores C-lineares A: € > C consistem simplesmente 
na multiplicação por um número complexo fixado « + ip. Assim, 
para todov=x+iy e C, tem-se Av = (a +iB)v= («+ iB)(x+iy) = 
ox — By + i(Bx + ay). 

A correspondência x+iy « (x,y) é um isomorfismo natural entre 
os espaços vetoriais reais C e R?. Pelo que acabamos de ver, esse 
isomorfismo faz corresponder a cada operador C-linear A:C 5 €, 
um operador R-linear A,: Rº > R”, dado por 


Arlx,y) = (ax — By, E ay), 


cuja matriz na base canônica é 
x — 
a] 
Excetuemos o caso trivial À = 0. Escrevamos 
p= Va R 


e tomemos O E R tal que cos O = «/p, sen O = B/p. Então a matriz 
de A, tem a forma 


cos O -—sen 0 
sen O cos0 |' 


Isto mostra que o operador A, é uma semelhança, composta da ro- 
tação de ângulo O com a homotetia de razão p > 0. As semelhanças 
são, portanto, os operadores de R? que correspondem aos operadores 
C-lineares não-nulos A: C 5 C. 

Guiados pelo Exemplo 21.2, observamos que se U = (u3,...,Un) 
c E for uma base do espaço vetorial complexo E então o conjunto 
U' = (um... Un, iy,..., im) C E é uma R-base, ou seja, é L.I. sobre 
os reais e, além disso, todo vetor v € E é uma combinação linear dos 
u; e dos iu; (;) = 1,...,n) com coeficientes reais. 

Com efeito, se «1,...,0n, B1,...,Pn E R então 


cu +---+onum + Prim ++ Brim —0 
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implica 

(01 +HiBiju ++ (on +iBn)un =0, 
logo « +iBj =---= an +iBn = 0 pois YU é L.I. sobre os complexos. 
Daíresulta que a, =--.=0on=Bi=---=Bn=0, portanto U' é LI. 
sobre os reais. Além disso, dado qualquer v E E, existem números 
complexos «y + if1,..., Gn + ibn tais que 








v= 3 (9 + iB;)u; = pa GU; + >. B; (iu). 
ja ja 


j=1 


Assim, U' é uma R-base para E. 

Com uma notação de significado evidente, podemos portanto con- 
cluir que se dimç E =n então dimp E = 2n. 

Seja la; + ibgl Ee M(m x n;C) a matriz da transformação 
C-linear A: E — F relativamente às bases YU = (w,...,un) C Ee 
V = (vy,...,vVm) C F. Considerando E e F como espaços vetoriais 
reais, A pode ser vista como uma transformação R-linear A,: E > F, 
a descomplexificada de A. Relativamente às bases 


LE = [gas as Uliçoe ss Elin PO É 
e 
Dr fr asas Um ira E É 
vejamos qual é a matriz de A,. Temos, paraj = 1,...,n: 
m m m 
Açu; = Au; = > (a +iby)ve = Do AjVk + E by(ivio); 
k=1 k=1 k=1 
m m 
A(iy)=Aliy)=i-Ay=5 (bon + alive), 
k=1 k=1 


Portanto a matriz procurada é 


c- n Ed eM(2m x 2n), 


onde a — [ay] e M(mxn) eb — [byl ce M(m xn). Esta matriz 2m x 
2n chama-se a descomplexificada da matriz lay +ibyl E M(mxn;C). 
Mostraremos logo mais que, quando m =n, tem-se det c > 0, e que 
det c = O se, e somente se, det À — O. 
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Todo espaço vetorial real E de dimensão par 2n pode (de infi- 
nitas maneiras) ser considerado como espaço vetorial complexo de 
dimensão n de tal forma que a nova multiplicação de um número 
complexo por um vetor coincida com a multiplicação anterior quando 
esse número complexo é real. Para isso, basta considerar um opera- 
dor R-linear J: E — E tal que J? = —I e definir, para cada número 
complexo € = « + if e cada vetor v E E, o produto € -v como €-v = 
av + BJv. (A adição de vetores continua a mesma.) 


A verificação de que esta definição atende às exigências sobre as 
regras operacionais é imediata. Resta apenas mostrar como se acha 
um tal operador J. Para isso, fxamos uma base de E, a qual nu- 
meramos da forma (w1,...,Un,V1,...,Vn). Existe um único operador 
R-linear J: E > Etal que Juy = vi,.. Jun =Va, Jvi =—Uyp-.s vn = 
—un. Nesta concepção de E como espaço vetorial complexo, o ope- 
rador J é simplesmente a multiplicação pelo número 1, logo v; = 
iu,...,Vn — im e lu,...,Un) C E é uma C-base. 

A noção de espaço vetorial complexo foi introduzida aqui a fim de 
servir como instrumento para obter resultados referentes a espaços 
vetoriais reais. 


A esse propósito, a principal vantagem dos espaços vetoriais com- 
plexos sobre os reais é a seguinte: todo operador linear A: ESE 
num espaço vetorial complexo de dimensão finita possui pelo me- 
nos um autovalor (complexo). Antes, porém, de estabelecermos e 
explorarmos este fato, vamos retomar uma afirmação anterior, se- 
gundo a qual tudo o que foi feito até a Seção 9 sobre espaços vetori- 
ais reais vale igualmente para complexos. Por que não foi incluída a 
Seção 10? 

É que se faz necessário modificar o conceito de produto interno 
quando se trata de um espaço vetorial complexo E. Se o produto 
interno for bilinear então (iv, iv) — (v,v) — —(v,v), logo não pode 
ser positivo. 

O impasse é resolvido mediante a noção de produto interno her- 
mitiano. Este é, por definição, uma função E x E > C que associa a 
cada par ordenado de vetores u,v no espaço vetorial complexo E um 
número complexo, representado pela notação (u, v), de tal modo que 
sejam cumpridas as condições seguintes, para quaisquer u,v,u E E, 
ce C, onde uma barra sobre um número complexo € = « + if signi- 
fica seu conjugado C = «— ip: 
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Lo (uv) = (vw); 

2. (u+u,v) = (uv) + (uv); 
3. (Cu,v) = (uv); 

4. (uu)>0,seu 0. 


Das propriedades 1. e 2. segue-se que (u,v +v) = (u,v) + (u,v). 
Com efeito, 





(u,v+v) = (V+vSu) = (Vu) 7 (Vu) = (v, u) Ea (Vu) 
=(u,v+(u,v). 


Analogamente se mostra que 1. e 3. implicam que (u, Cv) = 
C(u,v). Assim, o produto interno hermitiano é sesqui-linear, ou seja, 
linear na primeira variável e anti-linear na segunda. Segue-se de 1. 
que (uv) =(vu) S(u,v)ER. 


Exemplo 21.3. No espaço C”, o produto interno canônico é definido, 
parau = (E1,...,En)ev= (C,...,Cn), como 


(u, v) = Ely ess El 


As 4 propriedades acima são imediatamente verificadas de modo que 
se trata de um produto interno hermitiano. 


Exemplo 21.4. Seja E = Cº([a,b];C) o espaço vetorial complexo 
formado pelas funções contínuas f: [a,b] > CC, definidas no intervalo 
[a, b] e tomando valores complexos. Um produto interno hermitiano 
em E pode ser definido pondo 


b ds 
(6,9) = | to) a 
para f,g € E quaisquer. 


Exemplo 21.5. Em todo espaço vetorial complexo E, de dimensão 
finita, pode-se introduzir um produto interno hermitiano. (Na reali- 
dade, uma infinidade deles.) Basta tomar uma base (1,...,n/C E 
e, para dois vetores 


u= > E v= > Qu 
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quaisquer em E, pôr 
(u,v) => Ele 


Isto mostra que, como no caso real, a existência de um produto in- 
terno hermitiano num espaço vetorial complexo de dimensão finita 
não é uma propriedade adicional desse espaço mas apenas uma es- 
colha que se fez dentre infinitas possibilidades. 

A partir da definição de produto interno hermitiano há poucas 
adaptações a fazer a fim de que as restantes seções, de 10 a 20, 
tenham seus resultados validados (e alguns fortalecidos, como ve- 
remos logo mais). 

Uma das modificações a fazer como conseqgiiência da sesqui-line- 
aridade do produto interno hermitiano diz respeito ao Teorema 11.1, 
que passa a ter o seguinte enunciado: 


Teorema 21.1. Seja E um espaço vetorial complexo de dimensão 
finita, munido de um produto interno hermitiano. A correspondência 
que associa a cada vetor v E E o funcional linear b(v) =vV*: E 5 C, 
tal que v*(w) = (w,v) para todo w € E, é uma bijeção &: E — E* tal 
que (u+v)* = ut +vte (Cv)* = €.v* para quaisquer u,ve Ee tec. 


Acima, E* é, como antes, o dual de E, ou seja, o espaço vetorial 
complexo cujos elementos são os funcionais C-lineares f: E 5 C. 

A diferença entre os Teoremas 11.1 e 21.1 é que, neste último, a 
correspondência v —» v* não é um isomorfismo entre E e E*, pois falha 
a condição (Cv)* — Cv*, em vez da qual se tem apenas (Cv)* — Cy*. 
Com efeito, para todo w € E, tem-se 


(Cv) (w) = (w, CU) = C(w,v) = Ev*(w), portanto (Cv)* = Cv”. 


Por isso, ela se chama um anti-isomorfismo. 

O Teorema 21.1 pode então ser refraseado dizendo-se que a bije- 
ção p: E — E* nele definida é um anti-isomorfismo. 

Isto não impede de maneira nenhuma que se defina a adjunta 
A*: F > E de uma transformação C-linear A: E > F, entre espaços 
vetoriais complexos munidos de produto interno hermitiano, como a 
única transformação C-linear A*: F > E tal que 


(Av, w) = (v, Aíw) 


para v € E, w € F quaisquer. Valem as propriedades (A + B)* = 
A* + B*, (BA)* = A*B*, *' = I, (A*)* = A e (A*)! = (A-!)*, nesta 
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última entendendo-se (como antes) que A* é invertível se, e somente 
se, A é. A única diferença diz respeito à adjunta de CA. Tem-se 
(CA)* = CA* quando € é um número complexo. 

Outra mudança ocorre no Teorema 11.2, que passa a ter o enun- 
ciado abaixo. E e F são espaços vetoriais complexos, com produto 
interno hermitiano. 


Teorema 21.2. Se a matriz da transformação C-linear A: ES5F 
relativamente a bases ortonormais U = (w,.. sm) CEeV = 
tvi,..oVYm) CFé a =las]eM(mxn) então a matriz da trans- 
formação adjunta A*: F > E relativamente às bases V, U é a matriz 
a*=a!, transposta da conjugada de a. 


A matriz conjugada de a — lay] E M(m x n;C) é a matriz à — 
[ag] € M(m x n;C) onde cada elemento ax; é o número complexo 
conjugado do elemento correspondente a,; da matriz a. 

Um operador C-linear A: E — E chama-se hermitiano quando 
A = At, ou seja, quando (Au,v) = (u, Av) para quaisquer u,v € E. 
Em particular, quando u = v, temos (Av,v) = (v, Av). Portanto, 
quando A é hermitiano, a forma quadrática p(v) = (v, Av) só assume 
valores reais. 

Uma matriz a = [a,;] e M(nxn;C) chama-se hermitiana quando 
a — aí, isto é, quando a; — ax; para k,j — 1,...,n. Em particular, 
aj = q; para todo j = 1,...,n portanto a diagonal de uma matriz 
hermitiana só possui números reais. Para matrizes reais, hermiti- 
ana é o mesmo que simétrica. 

Um operador C-linear A: E > E é hermitiano se, e somente se, 
sua matriz relativamente a uma (e portanto a qualquer) base orto- 
normal de E é uma matriz hermitiana. 

Um operador C-linear U: E — E chama-se unitário quando 
U* — U”!. Isto equivale a dizer que (Uv, Uw) = (v,w) para quais- 
quer v,w €E E. 

Se U: E > E é um operador unitário então, para todo v € E tem-se 
[Uv| = |vl. Vale também a recíproca. Para prová-la, usa-se a identi- 
dade de polarização 





1 : : : : 
4 uv? = ju =vP + us iv? = ju =avÃ, 


cuja verificação é imediata. Sua forma é mais complicada do que a 
análoga real, devido ao fato de que o produto interno hermitiano não 


(u, v) = 
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é simétrico. 

Uma matrizu € M(nxn;C) chama-se unitária quandou* =u”!. 
Para que isto aconteça basta que utu = L,, ou que uu* = L,. À pri- 
meira destas igualdades significa que as colunas de u formam uma 
base ortonormal de C” (relativamente ao produto interno hermiti- 
ano). À segunda assegura a mesma propriedade para as linhas de 
u. As matrizes unitárias reais são as ortogonais. 

Feitas essas observações de caráter geral, passemos a tirar pro- 
veito da estrutura complexa. 

O determinante e o polinômio característico, como não têm nada 
a ver com produto interno, se definem de modo análogo ao caso real. 

Segundo o Teorema Fundamental da Álgebra, todo polinômio 


pPN)=a ++ Ha 


com coeficientes complexos qo,..., an (em particular, com coeficien- 
tes reais), com an = (—1)”, se decompõe como produto 


n 
PO =[[Q—) 

k=1 

de fatores do primeiro grau. Os números complexos A,...,An, não 
necessariamente distintos, são as raízes do polinômio p, cada um 
deles comparecendo na lista A4,...,An um número de vezes chamado 
sua multiplicidade como raiz do polinômio. A multiplicidade de Ay é 
m se, e somente se, m é o maior inteiro tal que p(A) é divisível por 
(A — A). 

Seja pa(A) = det(A — AI) o polinômio característico do operador 
C-linear A: E > E. O número complexo À, é uma raiz de pa se, e 
somente se, o operador À — Aol é não-invertível, ou seja, existe v £ O 
em E tal que Av = Aov. Portanto, para espaços vetoriais complexos, 
as raízes características de um operador A: E > E coincidem com 
os autovalores desse operador. Como as primeiras sempre existem, 
segue-se que todo operador C-linear possui autovalores (que podem 
ser reais ou complexos). 

A existência de autovetores nos espaços vetoriais complexos im- 
plica a seguinte versão fortalecida do Teorema 20.1, da qual decor- 
rerão todas as conclusões a que chegaremos nesta seção. 
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Teorema 21.3. Todo operador C-linear A: E > E é triangularizável. 


A demonstração é a mesma do Teorema 20.1. Só que agora não 
é necessário fazer hipótese adicional sobre A porque todo operador 
linear complexo tem autovetor. 

Como anteriormente, vale a importante observação de que se E 
possui produto interno hermitiano, o enunciado acima pode ser tor- 
nado mais preciso: existe uma base ortonormal 4 c E na qual a 
matriz de À é triangular superior (ou inferior, se assim o quisermos). 

A versão matricial desse teorema é: para toda matriz complexa 
a existe uma matriz unitária u tal que utau = u !au = t é uma 
matriz triangular. 

Vejamos, a seguir, algumas conseqiiências do Teorema 21.3. Na 
primeira delas, temos um operador linear A: E — E num espaço 
vetorial complexo E. 


Teorema de Cayley-Hamilton. Se pa é o polinômio característico 
do operador C-linear A: E > Eentão pa(A) = 0. 


Demonstração: segue exatamente a linha da demonstração do Te- 
orema 20.2 pois, em virtude do Teorema 21.3, todo operador C-linear 
é triangularizável. 














Evidentemente, vale uma versão matricial de Cayley-Hamilton. 
Para toda matriz a € M(n x n;C), o polinômio característico pa(A) 
é exatamente o polinômio pa (A), onde A: C” — C” é o operador C- 
linear que tem matriz a na base canônica. Tem-se também pa = PA 
para qualquer operador C-linear A: E > E cuja matriz, relativa- 
mente a uma base arbitrária em E, seja igual a a. Qualquer que seja 
o polinômio q(A), vemos que q(a) E M(n xn;C) é a matriz do opera- 
dor q(A) na mesma base relativamente à qual a é a matriz de A. Por- 
tanto, se pa é o polinômio característico da matriza e M(n x n;C), 
tem-se pala) = 0. 

Se acontecer de a matriz a ser real, seu polinômio característico 
pa é um polinômio real e ainda assim se tem pa(a) = 0, pois todo 
número real é complexo. Segue-se daí o 


Teorema de Cayley-Hamilton para operadores reais. Seja 
A: E > E um operador linear num espaço vetorial real E. Se pa é 
seu polinômio característico, tem-se pa(A) = 0. 
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Demonstração: Seja a e M(n x n) a matriz de À relativamente a 
uma certa base de E. Então pa(a) = O. Como pa(a) é a matriz do 
operador pa (A) nessa mesma base, segue-se que pa(A) = 0. 














Continuemos apresentando consequências do Teorema 21.8. 
Sejam a — [ay], b — [by] matrizes n x n triangulares superiores, 
de modo que ax — by — O sek >j. O j-ésimo elemento da diagonal 
do produto ab é (ab); — > ajbr;; — ajb; poisa; — Osej>reb; — O 
T: 


se j <r. Segue-se imediatamente que os elementos da diagonal de 
a” têm a forma a?. Daí resulta, mais geralmente, se p(A) é qualquer 
polinômio então p(a) é uma matriz triangular superior cuja diagonal 
é formada pelos números p(a;;), onde a;; percorre a diagonal de a. 

Se A: E > E é um operador C-linear, suas raízes características, 
ou seja, seus autovalores, são (contando multiplicidades) os elemen- 
tos da diagonal de uma matriz triangular que representa A rela- 
tivamente a uma base conveniente de E. Segue-se do que foi dito 
acima que, se p(A) é qualquer polinômio, os autovalores do opera- 
dor p(A), incluindo suas multiplicidades algébricas, são os números 
p(A;), onde A,...,An são os autovalores de A. 

Um caso particular interessante é o de um operador nilpotente 
A: E 5 E. Isto significa, como se sabe, que existe um inteiro m > O 
tal que AM = 0. Neste caso, sen = dim E afirmamos que o polinômio 
característico de À é pa(A) = (—1)PA?. 

Consideremos inicialmente o caso em que À é C-linear. Seja 4 
E uma base relativamente à qual a matriz a — [ay] do operador 
A é triangular superior. Os elementos a; da diagonal de a são os 
autovalores de A, contados com suas multiplicidades. O polinômio 
característico de À é portanto 


pa(A) = o (aj — À). 


Os elementos da diagonal de a” são apoj=1,..5mn. Como a” = 0, 
segue-se que todos os a; são nulos, logo o polinômio característico de 
A é pa(A) = (Ir. 

Do ponto de vista matricial, podemos afirmar que se a é uma 
matriz n x n (real ou complexa, tanto faz) com a” = O para algum 
m inteiro > 0 então seu polinômio característico é pa(A) = (—1)PA”. 

Daí resulta que, dado o operador R-linear A: E —> E no espaço ve- 
torial real E, com dim E =n, se tivermos A” = 0 para algum inteiro 
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m > 0 então o polinômio característico de À é pa(A) = (—1)"A”. Com 
efeito, este é o polinômio característico da matriz a do operador À 
numa base qualquer de E, a qual cumpre a” = 0, 

Em seguida, usaremos a forma triangular para provar que o de- 
terminante do operador A,: E > E, descomplexificado de um opera- 
dor C-linear A: E > E, é sempre > 0. 

Com efeito, seja U = (uy,...,un! C E uma base na qual a matriz 
m = [ax + iby] de À é triangular superior: ay = by — O sek > 5. 
Para todo j = 1,...,n, temos 


n 


Au; = > (as +iby)ux. 
k=1 


Consideremos agora a base U' = (uy, iu, ..., Un, in) do espaço veto- 
rial real E. Para obter a matriz c do descomplexificado A,: E > Ena 
base YU”, observamos que 


Ar U; = 3 (agu + by; “iu;) e A,- tu; = > Coyuy; + dy * tlz). 
k k 


2 


Daí resulta que a matriz c tem uma forma “triangular por blocos”. 
Mostramos abaixo esta matriz no cason = 3: 


o —Dj az —Bo Ga —by 
bm am by am by a 
“Io O a» —bz az —ba3 
Cc =: 
0 bz; a» bz 23 


0 
0 Õ Õ 0 a33 —b 33 
0 0 0 O bz as 


Segue-se imediatamente do Teorema 19.8 que o determinante da 
matriz c é dado por: 


n 


o ae as —by] 3 
det c = II det E E = Lo; + bi). (*) 


= = 


Sendo a matriz m = [ax + iby] triangular, os números complexos 
A; — aj + ib; são seus autovalores e det m — | [A;. Por outro lado, a 
igualdade (*) mostra que det c = |] IN. 
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Vemos então que det A, = det c > 0, valendo det A, = O se, 
e somente se, det A = detm = 0. Vemos também que det A, = 
|det A/?. 

Noutras palavras, dada a matriz n xn complexa m = [ax + ibyjl, 
formamos as matrizes reais a — [ay], b — [byl e M(n xn) e 


a —b 
pi a eM(nx2n). 


Vale então det c = | det m/2. 

Mais uma exibição de força do Teorema 21.3 é o seu uso para 
demonstrar a versão geral do Teorema Espectral para operadores 
complexos, conforme faremos agora. 

Um operador C-linear A: E — E num espaço vetorial complexo, 
de dimensão finita, chama-se normal quando comuta com seu ad- 
Junto, isto é, quando cumpre a condição AA* = A*A. Analogamente, 
uma matriz quadrada a chama-se normal quando aa* = a*a. 

Evidentemente um operador é normal se, e somente se, sua ma- 
triz relativamente a uma (e portanto a qualquer) base ortonormal é 
uma matriz normal. 


Teorema Espectral para operadores complexos. Seja E um 
espaço vetorial complexo, munido de um produto interno hermitiano. 
Um operador C-linear A: E > E é normal se, e somente se, existe em 
E uma base ortonormal formada por autovetores de A. 


Versão matricial do Teorema Espectral. Seja a matriz a € 
M(n x n;C). A fim de que exista uma matriz unitária u tal que 
d = utau é diagonal é necessário e suficiente que ata = aa*. 


Demonstração: Continuando com a veia matricial que tem predo- 
minado nestas últimas páginas, provaremos a segunda versão, cla- 
ramente equivalente à primeira. Seja u uma matriz unitária tal 
que t = u*au seja triangular. Tomando adjuntas, vem t* = uta*u. 
Multiplicando membro a membro: tt* = utauuta*u = u'aa“u. 
Fazendo a mesma multiplicação na ordem inversa: t“t = u“a*au. 
Como aa* = a*a, concluímos que t*t = tt*. Ora, sendo triangu- 
lar e normal, t deve ser diagonal. (compare (tt*);; com (t*t)i para 
1 = 1, depois i = 2, etc.) Assim uau é diagonal. Reciprocamente, se 
d = utau é diagonal então dd* = d*d, o que nos dá imediatamente 
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u*a*au — ut*aa*u. Multiplicando esta igualdade à esquerda por u e 
à direita por u* obtemos a*a = aa* logo a é normal. 














Corolário. Se A: E > E é um operador hermitiano, existe uma base 
ortonormal de E formada por autovetores de A. 


A matriz de À nesta base é diagonal e, sendo hermitiana, os ele- 
mentos da diagonal são números reais. Segue-se que os autovalores 
de um operador hermitiano são todos reais. 

Outro caso particular de operador normal é um operador unitário 
o qual também admite uma base ortonormal formada por auto-veto- 
res. Os autovalores de um operador unitário são números complexos 
de módulo 1. 


Exercícios 


21.1. Seja E um espaço vetorial real. O complexificado de E é o 
conjunto E. cujos elementos são as expressões formais u + iv, com 
uveEei=v-—1. Em Ec, a igualdade u +iv = u' +iv' significa, 
por definição, queu = u'ev = v'. À soma é definida por (u + iv) + 
(u'+iv) = (u+u) +i(v+v) e o produto por um número complexo 
é, ainda por definição, (« +iB)(u+iv) = (au — Bv) + ilBu + av). 
Para todo u E E, escreve-se u + i0 = u e com isso tem-se E C Ec. 
O complexificado de um operador linear A: E > E é Ac: E S Es, 
definido por Ac(u + iv) = Au +iAv. Prove: 





(a) Eç é um espaço vetorial complexo e Aç: Ec — Ec é um operador 
C-linear. O complexificado de R” é C”?. Ec Ec mas E não é um 
subespaço vetorial (complexo) de Ec. 


(b) Toda R-base (uy,...,un) C E é uma C-base de Ec. Em particu- 
lar, dimc E. — dimg E. A matriz de Aç: E; — Ec relativamente 
à base (u3,...,Un! E E coincide com a matriz de À na mesma 
base. Os polinômios característicos de Aç e de À são iguais. 


(c) Se A=a-HiB, com B£0, é autovalor de Ac, correspondente ao au- 
tovetor u-HiveEc, então (u, vj é a base de um subespaço vetorial 
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Fc E, invariante por À, e a matriz da restrição A: F > Fé 
q B 
—B XxX º 


21.2. Seja A: E — E um operador linear, com dim E =n. Considere 
o conjunto M de todos os polinômios p(A) tais que p(A) = 0. Prove: 


(a) Se pi(A),palA) E M e a, « são números então «ypi(A) + 
oopa(A) e M. 


(b) Sep(A) e Me q(A) é qualquer polinômio então p(A)q(A) e M. 


(c) Existe um único polinômio mônico ma(A) E M tal que todos 
os outros p(A) e M são múltiplos de ma(A). [Considere o po- 
linômio mônico de menor grau possível em M. Chame-o de 
ma(A). Para todo p(A) E M tem-se p(A) = q(A) -ma(A) +T(A), 
com gr-r(A) < gr-ma(A). Segue-se de (a) e (b) que r(A) E M, 
logo r(A) = 0.] 


(d) O polinômio ma (A) chama-se o polinômio mínimo do operador 
A. Ele é o polinômio mônico de menor grau tal que ma(A) = 0. 
As conclusões acima valem igualmente para espaços vetoriais 
reais ou complexos. 


(e) Se B: E 5 E é invertível então, para todo polinômio p(A), tem- 
se p(B! AB) — B!.p(A)- B. Segue-se que os operadores A e 
B-! AB têm o mesmo polinômio mínimo. 


(f) Para toda matriz a do operador A, ma(A) é o polinômio mônico 


de menor grau tal que ma(a) = 0. 


21.3. Determine o polinômio mínimo dos seguintes operadores: 


(a) O operador zero. 
(b) O operador «al, com « £ 0. 
(c) Uma projeção. 


(d) Uma involução. 
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(e) O operador de derivação D: P, > Ph. 
(f) O operador A: R? > R?, A(x,y) = (x +2y,2x +). 


(g) Qualquer operador A: R? > R?. 


Em todos estes casos, compare com o polinômio característico. 


21.4. Prove que um operador é invertível se, e somente se, o termo 
constante do seu polinômio mínimo é < 0. 


21.5. Seja p(A) um polinômio tal que p(A) = O. Prove que todo 
autovalor Ay do operador À é raiz do polinômio p(A). Conclua daí 
que toda raiz do polinômio característico pa (A) é também raiz do 
polinômio mínimo ma. (A recíproca é evidente porque ma divide pa.) 


21.6. Determine o polinômio mínimo do operador dado por Av = 
(v, a) b. 


21.7. Seja A: E — E um operador num espaço vetorial de dimensão 
n. Prove: se A* = 0 para algum k > n então A” = 0. 
[Sugestão: Teorema 21.3.] 


21.8. Prove que um operador é nilpotente (isto é A* = O para algum 
k e N) se, e somente se, todos os seus autovalores são iguais a zero. 


21.9. Se o operador À é diagonalizável e Ay,...,Ax são seus auto- 
valores distintos dois a dois, prove que o polinômio mínimo de À é 
ma = (AAA A): (AA). 


21.10. Se o operador A: E — E (num espaço vetorial complexo) é 
diagonalizável, prove que existe um produto interno hermitiano em 
E que torna À normal. 


21.11. Seja E um espaço vetorial (complexo) munido de um produto 
interno hermitiano. Prove que todo operador linear A:E > E se 
escreve, de modo único, como A = H+ik, onde H,K: E > E são 
operadores hermitianos e que À é normal se, e somente se, H e K 
comutam. 
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21.12. Sem fazer cálculo algum, conclua que o produto de duas ma- 
trizes 2n x 2n do tipo 
a —b 
b a 
é ainda deste mesmo tipo. 
21.13. Assinale V(erdadeiro) ou F(also): 


( ) O determinante de um operador hermitiano é um número real. 
( ) Os autovalores de um operador unitário são iguais a +1. 


( ) Os autovalores de um operador real anti-simétrico são do tipo 
+if, onde f é real. 





( ) Se 


" |cos0 —sen O 
“Isen0 cos0 |” 


existe uma matriz (complexa) 2x2 invertível p tal que p 'ap = 
d, onde d é diagonal (complexa). 


21.14. Prove que todo operador num espaço vetorial (complexo) de 
dimensão n possui um subespaço invariante de dimensão n — 1. 


21.15. Sejam A,...,Ah os autovalores do operador A:E > E 
(repetidos de acordo com suas multiplicidades algébricas). Dado um 
polinômio qualquer p(A), prove que os autovalores do operador p(A) 
são os números p(A1),...,p(An). [Sugestão: Teorema 21.3.] 


21.16. Prove que as seguintes afirmações acerca dos operadores li- 
neares A, B: E > E são equivalentes: 


(a) pa(B) é invertível. (Onde pa é o polinômio característico de A.) 
(b) A e B não têm autovalores em comum. 
(c) pB(A) é invertível. 


(d) Se ma e mp são os polinômios mínimos de À e B então ma(B) 
e mp(A) são invertíveis. [Sugestão: use o exercício anterior.] 
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21.17. Suponha que o polinômio mínimo ma(A) = (A—Aj)---(A— A) 
do operador linear A: E > E seja um produto de fatores distintos do 
primeiro grau (À ZA; sei 5). Prove: 


(a) Escrevendo ma(A) = pi(A)(A—A;) e B; = pi(A), tem-se A(B;v) = 
ABiv (L=1,...,k) para todo v e E. 


(b) Os polinômios pi (A),..., pe(A) são primos entre si, logo existem 
q1 (A), 8.809 qu(A) tais que 


k 
DN =1. 
i=l 


(c) Seja C; = q;(A). Para todo v E E tem-se v = LB;(Ci;v), logo os 
autovetores de À geram E. 


(d) O operador À é diagonalizável. 


21.18. Sejam A, B, X operadores lineares no espaço vetorial E. 
Prove: 


(a) Se AX— XB = 0 então A?X — XB? e, mais geralmente, p(A)X = 
Xp(B) para todo polinômio p. 


(b) Se À e B não têm autovalores em comum então AX — XB se, e 
somente se, X = 0. 


(c) Se A e B não têm autovalores em comum então para todo ope- 
rador linear C: E > E existe um único X E Z(E) tal que AX — 
XB=C. 


21.19. Sejam A,,...,An os autovalores da matriz a, repetidos de 
acordo com suas multiplicidades algébricas. Prove que 


M+ HMA => aja. 
Lj 


21.20. Se existir algum k E N tal que A* = I, prove que o operador 
A: E > E é diagonalizável. [Sugestão: Exercício 21.17.] 
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21.21. Sejam F, c F; subespaços invariantes do operador A: E 5 E. 
Se dim F; — dim K > 2, prove que existe um subespaço F, diferente 
de F, e F;, invariante por A, tal que F, CFC E. 


21.22. Seja A: E > E um operador nilpotente no espaço vetorial E 
(real ou complexo) de dimensão n. Tome k, o menor número natural 
tal que A* = 0. Prove sucessivamente: 


(a) (OFCN(A)CN(AZ)C...cN(AM)=E; 
(b) Se N (A!) = N (A) então N (AH) — N(Ait?); 
(c) Nenhuma das inclusões em (a) se reduz a uma igualdade; 


(d) k<nm. 


22 


Equações a 
Diferenças Finitas 


Em muitas aplicações da Matemática o tempo é discreto. Isto sig- 
nifica que, ao contrário da Cinemática, na qual o tempo flui con- 
tinuamente, nestas situações que temos em mente (Economia, por 
exemplo) as grandezas são medidas em instantes isolados, formando 
uma segiiência. Nestes casos, as equações diferenciais não são o ins- 
trumento adequado para exprimir a evolução dos fenômenos, sendo 
substituídas pelas equações a diferenças finitas. Nesta seção, estu- 
daremos os tipos mais simples dessas equações, como aplicação de 
alguns dos resultados obtidos nas seções anteriores. 


Numa equação a diferenças finitas, a incógnita é uma sequência 
(x0, X13 +++» Xk, ++. ), cujos termos devem satisfazer uma relação dada. 
Se a relação é do tipo xx,1 = f(xx), onde f é uma função determi- 
nada, tem-se uma equação de primeira ordem. Se é do tipo xk.2 = 
f(x, Xk+1), tem-se uma equação de segunda ordem, e assim por di- 
ante. 

Fixado arbitrariamente um número xo, toda equação de primeira 
ordem xx = f(x.) admite uma única solução (x0,X1,...,Xk,--.) 
com valor inicial xo. Basta tomar sucessivamente x; = f(xo), x2 = 
f(x1), etc. De modo análogo, fixados arbitrariamente xo e x1, toda 
equação de segunda ordem xx,2 = f(xw xk,1) admite uma única 
solução (xo, X1, X2,...,Xk,--- ) cujos dois valores iniciais são os núme- 
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ros dados. Basta tomar sucessivamente xz = f(xo,x1), x3 = f(x1,x2), 
etc. E assim por diante: toda equação de ordem n possui uma única 
solução cujos n valores iniciais são fixados arbitrariamente. 


Observação. Nesta seção, o primeiro termo de toda sequência tem 
índice 0, em vez de 1. 


Exemplo 22.1. A solução da equação de primeira ordem xk;1 = 
xx + b com valor inicial x, é a sequência (x,,Xo + b,xo + 2b,...), de 
termo geral x, = xo + kb (progressão aritmética de razão b). 


Exemplo 22.2. A equação x,y = axy (linear, homogênea, de pri- 
meira ordem, com coeficiente constante) tem para solução, com valor 
inicial xo, à sequência (xo, 4X, 42X0,..., 4*Xo,...) cujo termo geral é 
xk = a*.xo (progressão geométrica de razão a). 


Exemplo 22.3. Combinando os exemplos anteriores, seja xk,1 = 
axk+b a equação linear, não-homogênea, de primeira ordem, com co- 
eficientes constantes. Se (x0,xX1,...,Xk-..) é a solução desta equação 
com valor inicial x,, então temos sucessivamente: 


x1 = 0X +0D, 
x» =ax+b= axo + (1 + a)b, 
x=ay+b=ax+(I+a+a)b, 


= tas b= at (dade Mk 


Portanto a solução geral da equação xx.) = ax + b é 


1.=a* 


xk = qtixo + :b, se a] 


T-—-a 
Xk =X +k-b, se q=1. 


Exemplo 22.4. A equação x; = ax, + b pode ser olhada sob o 
ponto de vista de um operador linear A: Rº — Rº, no espaço Rº, 
cujos elementos são as sequências x = (x9,X1,-..,Xk.-..). O opera- 
dor A associa a cada sequência x a nova sequência y = Ax, onde 
Uk = Xk1 — axk. À equação dada equivale ao problema de achar 
os elementos x € Rºº tais que Ax = 6, onde b = (b,b,...) é uma 
sequência constante de termos todos iguais a b. Como vimos no 
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Teorema 6.4, a solução geral da equação Ax = b é a soma de um 
elemento qualquer do núcleo de A (solução geral da equação ho- 
mogênea Ax=0) com uma solução particular da equação Ax=b dada. 
Para obter uma dessas soluções particulares, tentamos a solução 
constante é = (c,c,...). O número c deve cumprir c = ac +, isto é, 
(1 — aje = b. Como no caso a = 1 já foi visto no Exemplo 22.1, supo- 
mos aqui a 1 e obtemos c = (1 — a) !.b. Por sua vez, a solução ge- 
ral de Ax = 0 (equação equivalente a xk,1 = ax) é uma progressão 
geométrica (p, ap, a?p,...) cujo primeiro termo p é arbitrário. As- 
sim, a solução geral da equação xx: = axx + b, para a < 1, é dada 
por x, = a“p+4+(1—-a)!.b. Note que x, = p+(1— a)!.b, donde 
p=xo—(1—a)!.b e, por substituição, vem: 





1 
w ts -cafl-arb+il=arb= ax + | :b, 


reobtendo o resultado do Exemplo 22.3. 


22.A, Sistemas Lineares 


Generalizando o Exemplo 22.2, podemos considerar, num espaço ve- 
torial E, um operador linear A: E > E e procurar uma sequência de 
vetores v, € E tais que 


Vk+1 = Avk (k=0,1,2,...). 


Isto se chama um sistema linear homogêneo de primeira ordem, 
de equações a diferenças finitas com coeficientes constantes. 

Evidentemente, dado arbitrariamente um vetor inicial v, € E, 
existe uma única sequência (vo,V1,...,Vk,...) de vetores em E, co- 
meçando com v, e cumprindo a condição v,,1 = Av para todo k > 0. 
Basta tomar v, = AF.vo. 

O problema prático de resolver o sistema v«,1 = Av reduz-se 
portanto ao cálculo das potências sucessivas A“ do operador A. Em 
geral, isto não é uma tarefa simples. Há, entretanto, casos par- 
ticulares em que ela é factível. Por exemplo, se existir uma base 
U c E formada por autovetores de À (o que se dá quando dim E =n 
e o polinômio característico de A tem n raízes reais distintas, ou 
então quando A é auto-adjunto), o vetor inicial v, exprime-se como 
combinação linear 

Vo =X +++ 


302 Equações a Diferenças Finitas Seção 22 


de vetores u EU, com Au; = Au; (L= 1,2,...,n). Segue-se que 
Ativo = x iu +. E Op STR (k=0,1,...). 
Exemplo 22.5. Seja A:R? — Rº o operador linear definido por 


Alx,y) = (2x + 29,2x — y). O sistema de equações a diferenças fi- 
nitas ve,1 = Ave, com v, = (x,y), escreve-se explicitamente como 


Xk+1 = 2xk + 2yk 
UYk+1 = 2Xk — Uk- 





O polinômio característico do operador À é p(A) = A? —- A — 6, cujas 
raízes são 3 e —2. Para obter uma base de autovetores [u,v) C R?, 
com u = (x,B) ev = (y,6), escrevemos as igualdades Au = 3u, 
Av = —2v em termos de coordenadas, obtendo os sistemas 


2x +2PB = 3a 
2xa— B =3B 
2y+26 = —2y 
2y—-b=-—26 


Estes sistemas são indeterminados. Têm que ser indeterminados 
pois os números 3 e —2 foram obtidos de forma que fosse assim. 

Tomemos as soluçõesa =2,B = 1,logou=(2,1),ey=1,60=-2, 
logo v = (1, —2). Então, para todo k = 0,1,2,3,... temos 


Atu =3Ku = (382,38) 


Atv=(-2)tv= ((-23%, (29) 





Para obter, digamos, a solução do sistema vk,1 = Av cujo vetor 
inicial é vo = (Xo,UYo), com x, = 1, yo = 1, exprimimos o vetor 
vo = (1,1) como combinação linear dos vetores básicos u = (2,1) 
ev=(1,-2), obtendo 
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Em termos das coordenadas v, = (xk, Ux), temos 


2 1 
xx = +(-98!] e ur = E A Lai 


No caso em que dim E = 2,0 problema de calcular efetivamente a 
solução do sistema v,.1 = Av, pode ser resolvido em todos os casos, 
como mostraremos agora. 

Tendo visto o caso em que o espaço E possui uma base de autove- 
tores do operador A: E=5E, vamos agora (supondo sempre dim E=2) 
examinar os casos em que tal base não existe. Há duas possibilida- 
des, que são as seguintes: 


Primeira. O polinômio característico de A possui uma raiz real 
dupla À, mas À AI. (Evidentemente, quando A = AI todo vetor 
não-nulo em E é autovetor de A, logo este caso já foi visto.) 


Segunda. O polinômio característico de A possui raízes complexas 
Atipgel-iu(comi=vy-leuzo0). 


Consideremos o primeiro destes dois casos. 


Existe um vetor não-nulo u E E tal que Au = Au. Além disso, 
somente os múltiplos de u podem ser autovetores de A. (Com efeito, 
sendo À o único autovalor de A, se existisse um autovetor v não 
múltiplo de u, teríamos uma base (u,v) c E com Au = Au, Av = Av, 
donde À = AI.) 

Tomemos um vetor v tal que (u,v) € E seja uma base. Então 
Av = «u+ Bv com « * O pois v não é autovetor. Se fôra 1, 
substituímos v por w = « !v e obtemos uma nova base fu,w) € E 
tal que Au = Au, Aw = u+Yyw. Na base (u,w), À tem a matriz 


triangular 
A 1 
0 y|? 


cujos autovalores são À, y. Segue-se que y = À. Assim, temos 


Au=AM () 
Aw =u+Aw 


e a matriz de À na base (lu, whém = o E] . 
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Das igualdades (*) resulta que para k = 0,1,2,..., tem-se 


Aku = Au 
Ay = ku + Ay, 


logo 


mis Ae ale 
0 Mo 


Exemplo 22.6. O operador A: R? — R?, dado por A(x,y) — (3x — 
y,x +y), tem o polinômio característico 


p(N)=A2—4A+4, 


o qual admite a raiz dupla A=2, sendo u=(1,1) um autovetor de A. 
Portanto (u,e,) C R? é uma base, com Au — Zu e Ae, = (-1,1) = 
—1.u+2-e>. Tomando w = —e> = (0,1), obtemos a base fu, w) C R?, 
com Au=2ue Aw=u+2w, logo a matriz de À na base (u, w) é 


cad 
Co 2] 
Pelo que foi dito acima, para obter a solução ve — (x, yk) — At.vo do 
sistema 


Xe = 3Xk — Uk, 
UV = Xk + Uk; 





com vetor inicial vo = (3,5), primeiro exprimimos v, como combina- 
ção linear de u e w, obtendo v, = 3u— 2w. Daí resulta que, para todo 
k=0,1,2,..., tem-se 


ve =3.Atu— 2.Ay. 
Como vimos acima, Atu — 2*u e Atw = k28 lu + 2kw. Logo 
ve=2(3-ku-2w=2%(3-k,5-—k). 
Em termos das coordenadas, isto significa que 


x =2H3-k) e yuc=2*5-X). 
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Para completar o estudo de sistemas lineares de equações a dife- 
renças finitas no caso 2 x 2, trataremos agora o caso de um operador 
linear A: E > E, (com dim E = 2) cujas raízes características são 
números complexos À + iLL,A — iu, com u £ 0. 

Será conveniente considerar o complexificado de E, que é o espaço 
vetorial complexo Ec, de dimensão (complexa) 2, cujos elementos têm 
a forma u + iv, onde u,v € E. As operações em E são dadas por 


tutiy)+(u+iv)=(utu)+Hi(vav) 


(a +iB)(u + iv) = (cu — Bv) +ilav + Bu). 





Tem-se EcE. de modo natural, pois u=u-+1.0. O operador A: ESE 
estende-se a um operador Ac: E. — Ec, chamado o complexificado de 
A, pondo-se, por definição, Ac(u + iv) = Au +iAv. Toda base de E 
é também uma base de Ec, relativamente à qual a matriz de Açé a 
mesma matriz de A. Em particular, os polinômios característicos de 
A e Aç coincidem, logo À +iu e À — iu são autovalores distintos do 
operador C-linear Ac: Ec — Ec. Para nossos efeitos, basta considerar 
o autovalor À + iu. 

Seja u-+iv € E um autovetor de Aç correspondente ao autovalor 
A+ig. Então u,v € E são vetores não simultaneamente nulos, com 
Acdutriv)=(A+Hiu)(u+iv),ou seja: 


Au +iAÃv=(Au-—pv)+Hi(uu-+Av), 


logo 
Au=Ahu—uv e Av=uu+A. (5) 


Afirmamos que os vetores u,v € E são linearmente independen- 
tes. Em primeiro lugar, u e v são ambos < O pois se um deles fosse 
nulo o outro seria 0 e, pelas equações (*), este seria um autovetor 
do operador A: E > E. Em seguida, se u e v fossem L.D. teríamos 
v=cu, logo Au=Au— uv=(À-—cujueu seria um autovetor de A. 

Portanto, (u, v) E E é uma base, relativamente à qual a matriz do 
operador A: E > E tem a forma 


o=[ 3 
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O cálculo das potências do operador À ou, equivalentemente, da 
matriz a se baseia na observação de que as matrizes da forma 


A e 

emo À 
se comportam, em relação à adição e à multiplicação, do mesmo 
modo que os números complexos À + it. 


Mais precisamente, se associarmos a cada número complexo 
z=x-+iy a matriz 


-|*X U 

p(z) = Ê ! 
teremos uma correspondência injetiva q tal que q(z + w) = q(z) + 
p(w) e p(zw) = q(z).p(w), onde z + w e zw são as operações 


de adição e multiplicação de números complexos e q(z) + q(w) e 
p(z).p(w) são as operações correspondentes com matrizes. 
Assim, se quisermos calcular a k-ésima potência da matriz 


BAN 


basta calcular (A + it)* — x + iy e teremos 


Ee e: 


Ora, as potências de um número complexo se calculam facil- 
mente com a fórmula de De Moivre: basta escrevê-lo sob a forma tri- 
gonométrica A+i = p(cos 0-+i sen 0) e então (A+iu)* = p*(cos ko + 
isen k0). Aí, p= VN +, cos 0 =A/pesen O = u/p. Portanto: 


A pi" x| cosk0O senk0 
—u A = —senk0 cosk0| 


Se temos, por exemplo, um operador A: R? — R?, dado por 
Alx,y) = (ax + by, cx + dy), cujas raízes características são os nú- 
meros complexos À +iu, segue-se da discussão acima que existe uma 
base (u,v) € Rº em relação à qual a matriz de At tem a forma 


«| cosk0 senk6 
—senk0 cosk0|" 
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onde 
p=VA+u, cos0=A/p, sen0=4/p. 


Depois de obtidos À, u, a base (u,v) se determina resolvendo o 
sistema Au = Au — uv, Av = tu +Av, de 4 equações com 4 incógnitas 
que são as coordenadas dos vetores u = (x,y) ev = (s,t). Em termos 
dessas coordenadas, o sistema se escreve como 


ax+ by = Ax—us 











cx+ dy = Ay—ut 
as+bt = ux+As 
cstdt = uyt+AM 
ou 
(a—A)x +Hby +us =0 
cx +(d— AJy +ut = 
—UX (a—A)s bt = 
—HUy +es +(d—-A)jt =0. 
Exemplo 22.7. Consideremos o sistema xk,1 = 3Xxk — Uk, UM = 
2xk + yr, com vetor inicial vo = (1,1). Ele nos fornece o operador 


A:R? 5 R?, A(x,y) — (3x — y,2x + y), cuja matriz na base canônica 


é 

3 — 

2 1) 
logo o polinômio característico é p(A) = A? — 4A+5, cujas raízes são 
2 +1. Existe uma base (u,v) C Rº, com u = (x,y), v = (s,t), tal que 


Au=2u-—v, Av=u-+2v. Para obter esta base, devemos achar uma 
solução não-nula do sistema 


de= = dk=S 
xy = cy 
| = R+25 
Esoo= ya 





ou seja 





—X +s —t = 
= Es E bl, 
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Por escalonamento, encontramos x = s —t,y = 2s — t, onde s, t são 
arbitrários. Tomamos s = 1,t = 0 e obtemos x = 1, y = 2. Logo 
u=(1,2)ev= (1,0) formam uma base de Rº, relativamente à qual 
o operador À tem a matriz 
Es | 2 | 
— 2/' 


O número complexo 2 + i tem módulo p = 5. Um ângulo 0 tal que 
cos O = 2/v5 é O = 26º33'54” ou seja, O = 0,463 rad. Então, para 
todo k = 0,1,2..., temos 


k 
Ez q o Kk| cosk0 senk0O 
E so Z = JA —senkO cosk0]|' 


A solução do sistema v;.1 = Av, com vetor inicial vo = (1,1) é 
dada por v; — At.vo. Para obtê-la explicitamente, devemos começar 
exprimindo vo como combinação linear dos vetores básicos u = (1,2) 
ev= (1,0). Temos vo = Ju + 5. Portanto 

1 1 


VES 5A*u + 5A%. 


é a matriz de A“ na base (u, v). Logo 


Atu =5"2(cosk60 -.u— senk6-v) 


Ora, a 


Aty =5"2(senk0 -u+cosk6-v). 
Noutras palavras: 
Atu =5K2(cosk 6 — senk 6,2 cosk 6) 


Aty =5K2(senk 6 + cosk 0,2 senk 6). 


Portanto 


1 1 
ve= Au + SAM = 5"2(cosk 0, cosk O + senk 6). 


Concluímos então que 
xk = 5"? cos k 8; 
yr = 582(cosk O + senk 6), 


com O — 26º33'54” = 0,463 rad, é a solução do sistema xy, 1 = 3xk—Uk, 
Uk+1 = 2xk + yk que cumpre xo = 1, yo = 1. 
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22.B. Uma Aplicação do Teorema de Cayley-Hamilton 


Uma forma alternativa de calcular as potências sucessivas A“ do 
operador linear A: E — E com dim E = n, consiste em observar 
que, em conseqiiência do Teorema de Cayley-Hamilton, basta que se 
considerem os expoentes k < n — 1. Com efeito, se 


p= AP aa pan Os 


é o polinômio característico do operador linear A, segue-se de 
pa(A) = 0 que 





A" =+(angA"! +... + A+ ql). 


Usaremos este fato para calcular as potências A* de um operador 
linear A: E > E, onde dim E = 2. Neste caso, o grau do polinômio ca- 
racterístico pa (À) sendo igual a 2, segue-se que o resto da divisão de 
A* por pa(A), para todo k > 2, tem a forma «A + p. (Por simplicidade, 
escrevemos «, 3 em vez de «x, Px.) Podemos portanto escrever 


NX =pa(A)-q(A) + ox + B, 


donde 
AF =palA)-q(A)+ «A + PL. 


Como pa(A) — 0, segue-se que A* — «A + BI. 

Para encontrar « e 3, suponhamos inicialmente que as raízes 
características A e Àz sejam distintas. Por definição, temos pa (A1) = 
pa(A2) = 0 logo da identidade A* — pa (A) - q(A) + «A + p resultam as 
igualdades: 


o + p — Ab 
ado + p = AS. 


Como estamos supondo À, < Az, temos acima um sistema determi- 
nado, que nos permite obter valores únicos para « e B. Observe 
que este argumento vale, inclusive, quando as raízes características 
A, e Az são números complexos. Neste caso, usa-se a forma trigo- 
nométrica para calcular as potências ak e As e vê-se que as soluções 
«, B do sistema acima são números reais. 

Consideremos agora o caso em que o polinômio característico 
pA(A) do operador linear A possui uma raiz (real) dupla A. Então 
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sabemos que Ay, além de raiz do polinômio pa(A), é também raiz de 
sua derivada p/ (A). Portanto a identidade 


A =pa(A)-q(A) + A+ B 
fornece a equação ah + 3 = vi enquanto que sua derivada 
KA! = pa (DN) -q(A) + pal) q) + a 


fornece, em virtude das relações p/, (M) = 0e pa(M) = 0, a igualdade 
a =k: AE], logo p = Ak(1 —k). 


22.€. Equações Lineares de Segunda Ordem 


Estudaremos apenas as que têm coeficientes constantes. Primeiro 
as homogêneas: 
Xk+2 + ax + bx, = 0. (*) 
Podemos reduzir o estudo da equação acima ao sistema linear de 
primeira ordem: 
Xk+1 = Uk 


Vk+1 = —bxk — ay, 


pe) 





onde foi introduzida a incógnita auxiliar ys = xk+1. (Em particular, 
Vo = x1.) Usando os métodos do item 22.4, obtemos as sequências 
(xx) e (yk), com valores iniciais xo, yo dados. Isto significa que a 
equação (*), quando são fixados os valores iniciais xo, x1, tem por 
solução a sequência (x) que responde ao sistema (**). Com efeito, 
temos: 

Xk+2 = Yk+1 = —bxk — ayr = —bx — dx. 





Portanto xk.2 + axks1 + bxk = 0. 

Observe que o polinômio característico do sistema (**) é p(A) = 
Nº + aA + b. Isto sugere que, a fim de estudar a equação (*), não é 
necessário ter feito anteriormente o estudo dos sistemas lineares. 

A seguir, mostraremos como resolver a equação (*), independen- 
temente de sistemas lineares. 

A primeira observação a fazer é que o subconjunto S C Rº, for- 
mado pelas segiências x = (X9,X1,...,Xk,-..) que são soluções da 
equação xk,2 + axk, + bx, = 0, é um subespaço vetorial de dimen- 
são 2. 
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O fato de que S é um subespaço vetorial é de verificação imedi- 
ata. (S é o núcleo do operador linear A: Rº — Rº, definido por 
Ax = y, onde yk = Xk+2 + dx 11 + bxe.) Além disso, o comentário feito 
no início desta seção sobre a existência e unicidade da solução de 
uma equação de segunda ordem xx,2 = f(xk, Xk+1), com valores inici- 
ais Xo, X1 pré-fixados, significa precisamente que a correspondência 
S > Rº, que associa a cada solução x — (x) da equação (*) seus dois 
primeiros termos (xo, x1), nesta ordem, é um isomorfismo entre S e 
R2. Portanto o espaço vetorial S tem dimensão 2. 

Este argumento mostra ainda que sex = (xx) e x' = (x) são 
duas soluções da equação x12 + ax, + bxk = 0 tais que os vetores 
(Xxo,x1) e (x, x4) são linearmente independentes então toda solução 
desta equação se exprime, de modo único, como combinação linear 
ax + px”. 

A segunda observação é que se r é uma raiz do polinômio carac- 
terístico À? + aA + b = 0 então a sequência 1* = (1,r,12,...,1*,...) é 
uma solução da equação xx.,2 + axk+1 + bx = 0. 

Com efeito, de 12 + ar + b = 0 segue-se que 


2 Lat sbrt=r"(m4artb)=r"x0=0. 


Resulta dessas duas observações que, para determinar todas as 
soluções da equação xk2 + axk+1 + bxk = 0, devemos usar as raízes 
do seu polinômio característico a fim de obter duas soluções linear- 
mente independentes. Todas as demais soluções serão combinações 
lineares destas. 

Há 3 casos a considerar. 


Primeiro caso. O polinômio característico Nº + aA + b tem duas 
raízes reais distintas r, s. 
Então as sequências 


2 k ) 


2 k 
TES (UTM os ) 


e Ss (SS usas suis 


são soluções e, como r £s, os vetores inicias (1,1) e (1,s) são L.I. em 
R?, logo 1* e s* são linearmente independentes em Rº. A solução 
geral da equação xx..2 + axk+1 + bxk = O é, portanto, 

xx = art + Bs*, 


onde as constantes « e p podem ser determinadas de modo que x, e 
x1 tenham valores pré-fixados. 
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Exemplo 22.8. A equação xx.2 — 3xk11 + 2xk = O tem o polinômio 
característico À — 3A + 2, cujas raízes são r = 1, s = 2. A solução 
geral desta equação tem a forma x, — « + 2*.p. Se quisermos, por 
exemplo, a solução com x, = 1 e x; = 0, temos que achar «, À tais 
que «+P =1e«+2B = 0,0 quenos dá a =2, 8 = —1, logo a solução 
procurada tem a forma xy = 2 — 2*. 


Segundo caso. O polinômio característico A? + aA + b tem uma raiz 
real dupla r £ 0. 

Tem-se r = —a/2, logo 2r+a = 0. Já sabemos que uma solução da 
equação xk:2+ ax +bx, = 061º = (1,1,...,78,...). Afirmamos que 
rt = (0,7,272,...,krk,...) é outra solução. Com efeito, se x, = kr* 
então 


Xe? + axu + bx = (k + 2)r2 + a(k + Dr + bkr* 
=r"[k(t” +ar+b)+r(2r+a)]=0. 


Além disso, como os vetores (1,1) e (0,7) são L.I. em R?, segue-se que 
r* e r** são soluções linearmente independentes, logo a solução geral 
da equação dada tem a forma 


x = art + Bkrt = ra + pk), 


onde as constantes « e ) podem ser determinadas de maneira a fazer 
com que x, € x; assumam os valores iniciais pré-estabelecidos. 


Exemplo 22.9. Seja a equação xx.2 — 6xk1 +9xk = 0. Seu polinômio 
característico tem a raiz dupla r = 3. A solução geral desta equação 
é xx = 3*(a + Bk). Se impusermos os valores iniciais xo = —1,x = 1 
obteremos « = —1, B = 4/3, logo a solução que tem esses valores 
iniciais é xx = 3*(—1 + 4k/3). 

Exemplo 22.10. Uma progressão aritmética pode também ser con- 
siderada como solução de uma equação a diferenças finitas de se- 
gunda ordem, a saber, a equação xx :2—Xk+1 = Xk+1—Xk. Escrevendo-a 
sob a forma xk,2 — 2xk+1 + xk = 0, vemos que seu polinômio carac- 
terístico possui a raiz dupla r = 1, logo sua solução geral é x = 
«+ Bk, ou seja, é a progressão aritmética de primeiro termo « e 
razão P. 


Terceiro caso. As raízes do polinômio característico À + aA +b são 
os números complexos « + i2 com 3 £L0,i=v-—1. 
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Escrevemos o número complexo r = « + 1f3 sob a forma trigo- 
nométrica r = p(cos O + isen 0). Exatamente como no caso real, 
verificamos que a sequência de números complexos r* = p*(cosk O + 
isenk 0), k = 0,1,2,..., é solução da equação dada. Mas é óbvio que 
se a, b são números reais e a segiência complexa (z5,21,...,Zk,.-.), 
com z, = xk + ty, é solução da equação zy.,2 + azx,1 + bz, = O então 
sua parte real x, e sua parte imaginária y, cumprem xy.,2 + AXk1 + 
bx = 0 e uw4,2 + ay, + by, = O respectivamente. 

Logo as segiências x, = p*cosk O e Uk = p*senk O são soluções 
da equação dada. Além disso, como (x0,x1) = (1, pcos 0), (yo,U1) = 
(0,psen 0) e sen 0 O (pois o número r não é real), vemos que 
(x0,X1) € (yo,y1) formam uma base de Rº, logo as soluções xx = 
p*cosk O e yr — p* senk O são linearmente independentes. 

Segue-se que a solução geral da equação xk,2 + axk + bx, = 0, 
quando a” < 4b, é dada por 


xx = pla cosk O + B senk 0), 


onde as constantes «, 3 podem ser determinadas de modo que x, e 
x1 assumam valores arbitrariamente pré-fixados. 


Exemplo 22.11. O polinômio característico da equação xk..2—2xk+1+ 
4x = O tem as raízes complexas 1 + iv3. Escrevendo 1 + iv3 
sob forma trigonométrica, temos, 1 + iv3 = 2(cos60º + isen 60º) = 
2 (cos Z +isen 5). A solução geral da equação dada é 





xk = 2* den da paso ; 
3 3 
Se quisermos, por exemplo, obter a solução tal que xo = 5,x1 = 7,08 
números «, B devem satisfazer as condições « = 5, B = 2v3/3. 
Como se vê, a discussão direta das equações de segunda ordem 
(lineares homogêneas, com coeficientes constantes) é bem mais sim- 
ples do que o estudo dos sistemas dos quais elas são casos particula- 
res. 


22.D. Equações com Segundo Membro Constante 


As equações de que vamos tratar são as do tipo 


Xk+2 + dXk41 + bxk = €. 
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Como se sabe, a solução geral desta equação é a soma de uma 
solução particular, que obtenhamos por qualquer processo, com a so- 
lução geral da equação homogênea x,.,2 + ax, + bx, = 0. Como já 
aprendemos a determinar esta última, basta-nos explicar como se 
pode conseguir uma solução particular. 

Começamos tentando uma solução constante x, = d. Devemos 
terd+ad+bd =c,ouseja (1I+a+b)d=c. Portanto, sel+a+b 0, 
a única solução constante possível para a equação dada é xx = d = 
pah. 

Sel+a+b =0, a equação dada (com c < 0) não pode ter solução 
constante. Tentamos uma solução do tipo x = k.d. Substituindo, na 
equação dada, x, por kd vem 


(k+2)d+a(k+ I)jd+bkd =c 


ou 





1+a+b)kd+(a+2)d=c. 


Como 1-+a+b = 0, obtemos (a+2)d = c. Portanto, quando 1+a-+b = 0 
ea -2,a segiiência x, = kc.(a + 2)! é uma solução particular. 

Finalmente, sel+a+b =0e a = —2 então b = 1 ea equação dada 
se torna xk;2 — 2xk+1 + Xxk = €, a qual não possui solução constante 
nem do tipo xx = k.d. Tentemos uma solução da forma x = K2.d. 
Substituindo xx por este valor na equação, obtemos 


(KR +4k+4)d-2(K +2k+])d+Kd=e, 


ou seja, 2d = c, donde d = c/2. Uma verificação imediata mostra 
que, realmente, xx = k?c/2 é uma solução particular da equação 
Xk+2 — 2X 1 + E. 

Observação. No início desta seção, vimos que a equação de se- 


gunda ordem xx.,2 + axk,1 + bx = O pode ser resolvida considerando- 
se o sistema 


Xk4+1 = Uk 
Vk+ = —bxk — aux. 





Mostraremos agora que, reciprocamente, se quisermos resolver o 
sistema 
xk+1 = qxk + byk 


(+) 
Uk+1 — Cxk + dyk 





Seção 22 Equações a Diferenças Finitas 315 


com vetor inicial vo = (xo, yo), podemos reduzi-lo a uma equação de 
segunda ordem, resolver essa equação pelo método que acabamos de 
expor e, a partir daí, obter a solução do sistema. 

Evidentemente, um dos números a,b,c,d é diferente de zero. 
Para fixar idéias, suporemos que b Z 0. Se (x) e (y) são as soluções 
do sistema (x) então 


Xk+2 = 0X + by 
= 0x1 + bexx + bdy 





— aXk1 + bexk + dxk+1 — adxk, 


logo, 
xk+2 — (a + d)xw + (ad — be)x = 0. (=) 


Para resolver o sistema (x) com vetor inicial vo = (xo,Uo), toma- 
mos a solução (xy) da equação (++) com os valores iniciais xo (dado) 
e x1 = axo + byo (com yo também dado). Em seguida, definimos a 
sequência (y.) pondo ys = (xk,1 — axk)/b. Isto dá imediatamente 
xkw+1 = ax + byx. Além disso, o valor yo obtido nesta fórmula coin- 
cide com o valor inicial yo anteriormente estipulado. Tem-se ainda 


VI = —IXk+2 — axk4] 


[(a + d)xk, + (be — ad)xk — axkn] 


= plla + d)(axk + by) + (bc — ad)x, — ax]. 


Simplificando, vem y,,1 = cxk + dy, logo as sequências (xy) e (uk) 
formam a solução procurada do sistema (x). 


Exercícios 


22.1. Para cada uma das equações abaixo, determine a solução que 
tem o valor inicial indicado 


(a) xei=Xk— 7x0. 





(b) Xk+1 — 6Xk, Xo — Ia 


316 Equações a Diferenças Finitas Seção 22 


(c) Xk1 = 2X +9D,X = 3. 
(d) Xk+1 = Xk + k, Xo — 2. 


k+1 
(e) xw1= 17 * Xk, Xo = Xo- 








22.2. Prove que o conjunto das soluções de uma equação do tipo 
xx = qkxk + bk (linear, de primeira ordem, homogênea ou não, com 
coeficientes variáveis) é uma variedade afim de dimensão 1 em Rºº. 
Em que condições é um subespaço vetorial? 


22.3. Uma solução do sistema 


Xi = GxXk + buy + Pk 
Vk+1 = CkXk + dkyk + q 








pode ser considerada como um par (s,t) de seqiências 


S= (Nous Meus), 
E = (Magos Us 
portanto um elemento de Rº x Rº. Prove que o conjunto S des- 


sas soluções é uma variedade afim de dimensão 2 no espaço vetorial 
Rº x Rº. Em que condições S é um subespaço vetorial? 


22.4. Para cada um dos sistemas abaixo, determine a solução 











(Vos cs Voc) Vk = (xwuyk), que tem o valor inicial vo = (Xo,Uo) 
indicado. 
Xk+1 = 2xk + 9yk xk+1 = 3xk + 16yx Xk+1 = Xk + 3yk 
Vk+ = Xk + 2Uyk Vc = —4xe — 13yk Uri = —2Xk + Uk 
(Xas to) = (3, —2) (Mastio) =— 9,2) [as a) = (—2,3) 


22.5. Seja ve = (xx, yk) uma solução do sistema 


Xk+1 = 2Xk — Uk 
Vk+1 — 4xk — 2uUk E 





Prove que, seja qual for o vetor inicial vo = (Xo,Vo), tem-se xx = 
yr = O para todo k > 2. 
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22.6. Sejam À e qu as raízes características (reais ou complexas) do 
operador A:R? — R?. Suponha que A) < 1elul<1. Seja qual 
for o valor inicial vo = (xo, Vo), prove que a solução v, = (x, Ux) do 
sistema vk,1 = Av, cumpre lim xk = 0, lim yk = 0. 


22.7. Sejam Tr = (Xo;2»sXeu0) ES = (Vos c0, Uky.++) S0luções da 
equação zx.,2 + az, + bz, = 0. Assinale V(erdadeiro) ou F(also): 


( ) Seres são LI. então, para quaisquer índices k < £, os vetores 
u=(xox)ev= (yu) são LI. 


( ) Se existirem k £ £ tais que os vetores u = (xy, xe) ev = (Ur, Ur) 
são L.I. então as soluções r e s são L.l. 


( ) Se, para todo k > 0, os vetores u = (xy xwi) ev = (Us Ukr1) 
forem L.D. então re s são L.D. 


( ) Seres são L.D. entãou = (xp, xe) ev = (ys, uy.) são L.D., sejam 


quais forem k e t. 


228. Sejaii 1=(Rogee Nissa EE vesg is esado 1 EGy sea o 
soluções da equação w.3 + awk+2 + bw + ckwk = 0. Prove: 


(a) Se existirem k < £ < m tais que os vetores v = (xy XxX Xm), 
vV = (VbybUym) ev” = (zx,Z,Zm) são L.I. então as sequências 
r,setsão LI. 


(b) Ser, s et são L.I. então existe k > 0 tal que os vetores 


V= (Xi Xe, Xk42), V=(Y Un Vi2) € VO=(Ze,Zk+1, Zk42) 
são L.I.. 
22.9. Prove que as sequências r = (1,2,3,4,0,0,...), s = (1,2,3,1, 
0,0,...) et = (1,0,0,3,0,0,...) não podem ser soluções da mesma 


equação xk,3+axk,2+bxk11 +Hexk = 0. [Sugestão: item (b) do exercício 
anterior.] 


22.10. Seja E: Rº > Rº o operador linear definido por 


E(Xo,X13.0+4Xky +++) = (XI, Xp we es KT rose) 
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Prove que um subespaço vetorial S c Rº é o conjunto das soluções 
de uma equação linear homogênea de ordem n com coeficientes cons- 
tantes, 

Xen + UXn ++ ax =0, 


se, e somente se, cumpre as condições seguintes: 
(1) S é invariante por E; 
(2) S tem dimensão finita, igual an. 


22.11. O método apresentado em 22.B para calcular as potências 
Ak mediante o uso do Teorema de Cayley-Hamilton dá fórmulas 
explícitas para essas potências como combinações lineares de 
LA,..., AN, mas faz uso das raízes características do operador A, 
que são facilmente calculáveis em dimensão 2 porém difíceis de ob- 
ter em dimensões superiores. Caso se deseje, não a fórmula geral 
para Ak, mas apenas o cálculo explícito de uma dessas potências, 
como A!º por exemplo, a alternativa seguinte utiliza apenas o cálcu- 
lo do polinômio característico pa (À), o que é bem mais factível: Usa- 
se o algoritmo da divisão para escrever Nº — pa(A) - q(A) + r(A), onde 
o grau do resto r(A) é menor do que a dimensão do espaço E. Tem-se 
então A* = T(A). Usando este método, mostre que, dado o operador 
A: Rº > Rº, onde A(x,y,z) = (x+2y+3z,3x+y+2z,x—y-+2z), tem-se 
AS=40A2+19A-— 143.10 A!O = 14281. A242246.A —4907].1. 





22.12. Para cada uma das equações abaixo, determine a solução que 
tem os valores iniciais indicados. 


(o) Xu Gn rm MSL 


(b) Exi+2 = 2Xk+] = DXko Xo — 2, X1 =— —1. 





(c) xw2— 6x1 +25x=0,x0=1,x72=3. 





22.13. A segiiência de Fibonacci (x0,x1,...,Xk,-..) é definida pelas 
condições xo = 0, xi = 1 e xk12 = xk11 + xk. Obtenha a fórmula geral 
para xx em função de k, prove que xk;2 = 1+x1 +-:-+xy e que 

Xk-+1 1 + v5 


lim = (o número de ouro). 
k5o0 Xk 2 





Seção 22 Equações a Diferenças Finitas 319 


22.14. Qual a fórmula que exprime x, em função de xo, x e k, 
sabendo-se que 


— 


Xk+2 = 7 ka +xk) 
para todo k > 0? 
22.15. Resolva a equação x.,3 — 6x2 + 1xw1 — 6x = 0. 


22.16. Ache a solução v, = (xx, yx) do sistema 


Xk+1 = Xk — (x — Uk) 
Va = Uk + Blxx — Ux); 





com vetor inicial vo = (Xo,Yo), com yo <xo,)O<a<le0O<p<l. 
Mostre que lim xx = lim yk = (Bxo + «yo)/(a + B), logo este limite 
está mais próximo de xo do que de yo se, e somente se, « < B. Mostre 
que se tem xx < uy para todo k se, e somente se, « + 3 < 1, em cujo 
caso a sequência (xy) é decrescente e (y,) é crescente. 


[Observação: este sistema é um modelo para uma situação sim- 
ples de barganha. Cada x, é o preço do vendedor e y, é a proposta 
do comprador. Em cada etapa, o vendedor oferece um desconto pro- 
porcional à diferença de preços na etapa anterior e o comprador, por 
sua vez, aumenta sua proposta de modo análogo. Se a soma « + p, 
da constante do vendedor com a do comprador, for maior do que 1, 
já na primeira etapa tem-se x; < y1, 0 que daria o chamado “negócio 
de pai para filho”...] 


22.17. Seja xx +12 + axk,1 + bxk = O uma equação cujas raízes carac- 
terísticas são os complexos conjugados r e T. Escreva r = p(cos O + 
isen 0) como x, = «p* cos( + k6), onde as constantes « e p podem 
ser determinadas de modo a fazer com que x, e x; assumam os va- 
lores iniciais pré-estabelecidos. [Sugestão: a equação dada admite a 
solução geral complexa x, — Cr + nt*, onde C,m E C são arbitrários. 
Tomando n = £, obtém-se a solução real x, — 2 Re (Cr*). Escreva 

= S(cos B +isen B) e use a fórmula cos(x + y) = cos x- cos y — 
sen x: sen y.] 
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22.18. Dada a equação xk,2 + axk,1 + bxk = c*, onde c não é raiz 
característica, prove que existe M E R tal que x. = M - ct é uma 
solução particular. Se c é uma raiz característica diferente de —a/2, 
prove que existe N tal que x, = Nkc* é uma solução particular. E se 
c=-—a/2 é raiz característica prove que existe P tal que x, = Pk?ck 
é uma solução particular. 





22.19. Se ves = «vs + we, onde jul < 1e Jim wk = 0, prove que 
—00 

lim v, =0 

k-o00 

22.20. Seja A: E > E um operador linear cujos autovalores cum- 
prem IM| < 1,...,/An| < 1. Prove que, para todo v E E, tem-se 
tim Aky = 0. [Sugestão: Tome uma base (u,...,un) C E na qual 
—s00 


a matriz de À seja diagonal superior. Observe que Au; = w + Aju, 
onde w E S(u,...,u 1) sei > 1e Au, = Muy. Logo Au, = 
Atw + A; Atu;. Ponha v; = Atu;, we = A*w, « = À; e tenha va = 
ave + wk. Use indução em i e o exercício anterior para concluir que 


lim Au, =0 (i=1,...,n),e daí lim Av =0 paratodo ve E.] 
ko ko 


Apêndice 


A Forma Canônica de Jordan 


O objetivo deste apêndice é provar que, dado um operador linear 
A: E > E num espaço vetorial complexo de dimensão finita, existe 
uma base de E na qual a matriz a de A é formada por uma série 
de “blocos de Jordan” ao longo da diagonal. Um bloco de Jordan é 
uma matriz triangular inferior cujos elementos diagonais são todos 
iguais a um mesmo auto-valor de A e os elementos imediatamente 
abaixo da diagonal são iguais a 1. Diz-se então que a matriz a está 
na forma canônica de Jordan. Quando E possui uma base formada 
por auto-vetores de A, os blocos de Jordan são todos 1 x 1, e neste caso 
a forma canônica de Jordan para A é uma matriz diagonal. 

A forma canônica de Jordan exibe a matriz mais simples que 
se pode obter para o operador A. Ela se mostra útil no estudo de 
questões que envolvem potências sucessivas do operador A, como as 
equações diferenciais lineares e as equações a diferenças finitas line- 
ares. 


Al. Operadores Nilpotentes 


Nesta seção, estudaremos mais um tipo de operadores que podem 
ser representados por matrizes especialmente simples, a saber, os 
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operadores nilpotentes. Os espaços vetoriais aqui considerados po- 
dem ser reais ou complexos; não faz diferença. Tampouco se ne- 
cessita de um produto interno. Veremos que, mesmo no caso real, 
os operadores nilpotentes possuem matrizes triangulares. O estudo 
aqui feito serve de preparação para a seção seguinte. 

Um operador linear A: E — E diz-se nilpotente quando se tem 
Ak = 0 para algum k E N. O índice de um operador nilpotente é o 
menor número k € N tal que A* = 0. Isto significa que AM! 0 e 
AF =0. 

Analogamente, uma matriz quadrada a chama-se nilpotente 
quando se tem a* = 0 para algum k EN. Seat! Z0ea*=0, 
diz-se que a matriz nilpotente a tem índice k. 


Exemplo Al.1. O operador de derivação D: P, — Ph é nilpotente, 
com índice n + 1. 


Exemplo Al.2. Um exemplo simples de matriz nilpotente é dado 
pela matriz k x k cuja k-ésima coluna é o vetor nulo e, para 1 < j < 
k — 1, sua j-ésima coluna é e;,1 € RK. Para k — 4 essa matriz tem a 
forma abaixo: 


0000 

ao É 0 00 

0100 

o 010 
A matriz deste exemplo provém do operador A: R* — R*, definido 
por Aey = e2,...,Aex 1 = e, Ae, = 0. Evidentemente, tem-se AF = 


0e AN! £0. Logo o índice do operador A (e da matriz a) é igual a k. 


Teorema Al.1. Dado o operador A:E > E, sejjau E E um vetor 
tal que AN lu +0e Atu = 0. Então os vetores u, Au,...,AN lu são 
linearmente independentes. 


Demonstração: Seja 

qu+oAu+---+oyAtlu o. 
Aplicando o operador AM! a ambos os membros desta igualdade, 
obtemos «At! u = 0. Como AM lu 0, concluímos que «j = 0. 


Logo a combinação linear inicial se reduz a 


ogAu ++ ot u0. 
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Aplicando o operador At2, obtemos agora «A! !u = 0, logo « = 0. 
Prosseguindo analogamente, tem-se «xy = 0) =---= ak =0. 




















Corolário 1. Num espaço vetorial de dimensão n, o índice de um 
operador nilpotente é <n. 


Corolário 2. Seja A:E > E um operador nilpotente de índice n 
num espaço vetorial E, de dimensão n. Existe uma base de E na qual 
a matriz de A tem a forma abaixo: 


000 --- 00 
| dd ses DD 
O 1 Os OO 
DO do as TO 


Vale, evidentemente, a recíproca do Corolário 2 acima: se alguma 
matriz do operador A: E — E (onde dim E = n) tem a forma acima 
então A é um operador nilpotente de índice n. 

Se o índice do operador nilpotente A: E — E for menor do que a 
dimensão do espaço E, mostraremos a seguir que existe uma base de 
E na qual a matriz de À é formada por blocos do tipo acima, dispostos 
ao longo da diagonal. 

Aidéia da demonstração é extremamente simples, mas a notação 
pode tornar-se longa. A fim de evitar complicações tipográficas, tra- 
taremos os casos de índices mais baixos, deixando claro o processo 
indutivo que leva ao caso geral. 

O argumento se baseia no seguinte fato, que foi estabelecido na 
demonstração do Teorema do Núcleo e da Imagem, e que destacare- 
mos aqui como um lema: 


Lema. Se [Aui,...,Au,) é uma base da imagem do operador 
A: ES Ee lvi,...,vg) é uma base do núcleo de A então (u,...,Up; 
V1,---» Vq) é uma base de E. 


Seja inicialmente o operador nilpotente A: E > E, de índice 2: 
AL0eA?=0. 


Tomemos uma base (Au, ..., Aup) da imagem de A. A condição 
A? = 0 significa que ZTm(A) C N'(A), logo existem vetores v3,... »Vq 
tais que 


U = (Aus,..., AUp, VI, Vg) 
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é uma base de N'(A). Pelo Lema, o conjunto 
V = fu, Au... Up, AUp, VI, eos Va) 


é uma base de E. 
Em relação a esta base V, a matriz do operador nilpotente 
A: E > E, de índice 2, é formada por p blocos de matrizes 2 x 2 


do tipo 
00 
10 


ao longo da diagonal (onde p é o posto de A), seguidos de q colunas 
nulas, onde 2p + q = dim E. 

Por exemplo, se A: Rº — Rº é nilpotente de índice 2, sua matriz 
na base V tem uma das formas abaixo, conforme seu posto seja 2 
ou 1: 


O 0000 00000 
1000 o ' 0 0 0 o 
00000 00000 
0010 ] E 0 00 ] 
00000 00000 


Em seguida, consideremos um operador nilpotente A: E > E de 
índice 3. 

A restrição de À ao subespaço invariante Zm(A) é um operador 
nilpotente de índice 2. Lembrando que os elementos de ZTm(A) são 
todos da forma Au, resulta do que vimos acima que existe uma base 
de Zm(A) do tipo 


(Au, AZus,..., Au,, AP tips AVI pres AVG 








com A?yv; = --- A?vg O. Os vetores linearmente independentes 
Alu,..., A?up, Avi...» Avg pertencem ao núcleo de A, logo podem 
ser incluídos numa base: 


uU =(Alus,..., Au, Avi, AV WI. MPC N(A). 
Segue do Lema que o conjunto 


V = (u, Au, AZu,..., 


2 
Up, AUp, A Up, VI, AVI, os Vo ÁVg WI co Wr) 
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é uma base de E. 
Em relação a esta base V, a matriz do operador nilpotente 
A: E > E, de índice 3, é formada por p blocos de matrizes 3 x 3 


da forma 
000 


100 
010 


ao longo da diagonal, seguidos por q blocos de matrizes 2x2 da forma 


0 0 
o) 
ainda ao longo da diagonal, e por r colunas de zeros. (Aqui, p é o 
posto de AZ, 2p+q é o posto de A ep-+q+r é a dimensão de N'(A).) 
Eventualmente, pode-se ter q = 0 our = O (ou ambos). Mas as 
três primeiras colunas do operador nilpotente A, de índice 3, na base 
V, devem ser e,, e3 e 0. 
A discussão acima assegura, para um operador nilpotente 
A:Rº — Rº de índice 3, uma base V na qual sua matriz tem uma 
das formas seguintes 


00000 00000 

E 10000 

01000] ou |/0 100 0], 
o 0 0 0 o CR o 

00010 00000 


conforme o posto de À seja 3 ou 2. 

O caso geral se trata da mesma maneira. A fim de dar mais 
precisão e clareza ao seu enunciado, vamos introduzir uma definição. 

Dado um operador nilpotente A: E — E, dizemos que um su- 
bespaço vetorial F € E é cíclico (em relação a A) quando existe um 
vetor u € Ftal que AMu = 0efu,Au,...,AM-lyul é uma base de 
F. Isto significa que F c E é um subespaço vetorial de dimensão 
m, invariante por A, e que a restrição de A ao subespaço F é um 
operador nilpotente de índice m. 

Por exemplo, na base V, acima obtida quando analisamos um 
operador nilpotente de índice 3, cada um dos vetores u1,...,up gera 
um subespaço cíclico de dimensão 3, cada v;(j = 1,...,q) gera um 
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subespaço cíclico de dimensão 2 e cada we(l = 1,...,7) gera um 
subespaço cíclico de dimensão 1 (o que significa Aw|=---=Awç=0). 
O resultado fundamental sobre operadores nilpotentes é o 


Teorema Al.2. Seja A: E > E um operador nilpotente de índice k 
num espaço vetorial de dimensão n. Existem inteiros ky =k > kz > 
-->k >0, tais que E=H&---& F,, onde cada F; é um subespaço 
cíclico de dimensão ki. 

Evidentemente, kj +---+k,=n. 

Tomando em cada F; (1 = 1,...,7) uma base V, = (ui, Au;,..., 
Aki-lu;), obtemos uma base V = VU...UY,, em relação à qual 
a matriz de À é formada por r blocos a e M(k; x k;), ao longo da 
diagonal. Cada bloco a; tem a forma vista no Exemplo 2: para j < ki; 
sua j-ésima coluna é e;,1 € Rk enquanto sua ki-ésima coluna é zero. 


A2. Existência da Forma Canônica de Jordan. 


Dado um operador linear A: E — E num espaço vetorial complexo 
de dimensão finita, provaremos que existe uma base em E na qual a 
matriz de À tem a forma canônica de Jordan: é triangular inferior, 
os auto-valores que formam sua diagonal são repetidos consecutiva- 
mente de acordo com suas multiplicidades algébricas e, além disso, 
os elementos imediatamente abaixo da diagonal são iguais a O ou 1; 
todos os demais elementos são nulos. 


Teorema A2.1. Seja A: E > E um operador linear num espaço veto- 
rial (real ou complexo) de dimensão finita. Existe uma decomposição 
E=F& G, como soma direta de subespaços invariantes F, G tais que 
A é nilpotente em Fe invertível em G. 


Demonstração: Como a dimensão de E é finita, a sequência de su- 
bespaços invariantes 


E>DZm(A)D Im(A?)D... 
não pode ser estritamente decrescente para sempre. Seja então k o 
menor número natural tal que Zm(A!) = Zm(A*+!). Afirmamos que 


então Tm(Ak+!) = Tm(Ak+2). Com efeito, 


TIm(AMt?) = AIZm(AMtD] = AZm(AS)] = Tm(AM!). 
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Segue-se que Tm(At?) = Tm(A*2), etc. Note-se que vale 
N(A) CN(A?) CC N(AM) = N(AMI) — (AM) —... 
Com efeito, pelo Teorema do Núcleo e da Imagem, temos 


dim N(A!) = dim E — dim Zm(AM!) 
= dim E — dim Zm(A*) = dim N'(AS). 


Sejam F= N'(A*) e G = Tm(A*). Evidentemente, Fe G são invarian- 
tes por À e a restrição A: F — F é nilpotente. Além disso, a restrição 
A: G > G é um operador sobrejetivo pois 


A(G) = ALm(AS)] = Zm(AM!) = Tm(AS) = G. 


Logo A: G > G é invertível. Mostremos agora que E = F+ G. Dado 
v E E, como Tm(A*) = Tm(A?), existe x E E tal que Aty = AZkx. 
Então, se escrevermos 


v=(v— Aky) + Akx, 


veremos que A*(v — Atx) = Atyv— Akx = 0, logov— Alx E Fe, 
obviamente, Atx E G. Assim, todo elemento v E E é soma de um 
vetor de F com um vetor de G, ou seja, E = F+ G. Para concluir que 
E=Fg&G, resta apenas mostrar que FN G = (0). Ora, sabemos que 


dim F+ dim G = dim(F+ G) + dim(FN G) 
= dim E + dim(FN G). 
Por outro lado, o Teorema do Núcleo e da Imagem, aplicado ao ope- 


rador A*: E — E, nos dá dim E = dim F+dim G. Segue-se então que 
dim(FNG) = O, istoé, FNG = (0). 














Teorema A2.2. Seja E = F& G como no Teorema A2.1. Sençé a 
multiplicidade algébrica do autovalor O do operador A: E > E então 
a dimensão do subespaço F é igual a no. Além disso, F é o núcleo e G é 
a imagem de APo: E — E. Segue-se daí que a decomposição E = FG, 
com as propriedades enunciadas naquele teorema, é única. 

Demonstração: Sejam A':F > Fe A”:G > G as restrições do 


operador À aos subespaços invariantes Fe G. Como A' é nilpotente 
e A” é invertível, o polinômio característico de A' é pa'(A) = (—A)”, 
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n = dim F, e o de A” cumpre a condição par(0) £ 0. A prova do lema 
que antecede o Teorema 20.1 nos dá pa = pa: : pa”. Por outro lado, 
pa(A) = Nº - q(A), com q(0) £ 0. Assim, A. par(A) = No. q(A), com 
par(0) £ 0 e q(0) Z 0. Segue-se que n = no. Sendo A nilpotente no 
subespaço F de dimensão ny, tem-se Fc N'(A"o). Reciprocamente, 
seu € N(A"o), escrevemos u = v+w, com v E F (logo ATov = 0) e 
w e G. Então O — Alov4+ ATow — ATow. Sendo À invertível em G, de 
A"ow = 0 conclui-se que w = 0, logou = v E F. Assim, F= N'(A?o). 
Para provar que G = Zm(A?o), observamos primeiro que, sendo À 
invertível em G, o operador APo: G — G também é invertível, logo 
G c Zm(A?o). Por outro lado, para todo u E E, escrevendo u = v+w 
com v E Few e€ G, temos A"oy = A"ow E G (pois G é invariante por 
A) logo Tm(A"o) c G. Assim, Tm(ATo) = G. 0] 





Observação. Para uso na demonstração do próximo teorema, note- 
mos aqui quese E = H+---+F, e dim E > dim KH +---+dim F, então 
E=H6---&F,. Com efeito, tomando em cada subespaço F; uma 
base V; (1 =1,...,7),0 conjunto V = V/U...UV. gera E e o número 
de elementos de V é < dim E, logo V é uma base de E. Assim, todo 
vetor v € E se exprime, de modo único, como soma v = vj +--- +Hvy, 
com vw € H,...,vr; € F,. Noutras palavras, E=H &---.0 6. 


Teorema A2.3. Sejam A,...,A os auto-valores distintos do ope- 
rador A: E > E, num espaço vetorial complexo de dimensão finita. 
Para cada à = 1,...,7, sejam n; a multiplicidade algébrica de À; e 
E; = NI(A — A; Di]. Então dm E =n,eE-E O--- DE. 


Demonstração: Mostremos inicialmente que n; é também a multi- 
plicidade algébrica do auto-valor O do operador A; = À — A;I. Com 
efeito, pa, (A) = deti(A—A; 1) —AI] = detlA— (A+A;)I] = pa(A+Ai). Te- 
mos pa(A) = (A— A)": q(A) com q(A) £ 0. Logo pa, (A) = pa(A+Ai;) = 
A". r(A), onde T(A) = q(A + Ai), portanto r(0) Z O. Isto posto, 
o Teorema A2.2 nos assegura que dim E; = n;. Em particular, 
dim E, + --- + dim E, = dim E. Pela observação que precede este 
teorema, resta-nos apenas provar que E = E; +---+ E,. Ora, o po- 
linômio característico do operador À se decompõe na forma 


r 


PAN) =[[A-). 


ja 
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Se pusermos 
q) =[[A-N)", 
jA 
obteremos os polinômios qi(A),..., gr(A), primos entre si. Por um 
conhecido teorema de Algebra, existem polinômios my(A),..., m,(A) 
tais que 
mai (A qu(A) +=: + mi(A)qr(A) = 1. 


Segue-se que 
mi(A)qi(A) +--- + mi(A)qr(A) = 1. 
Assim, para todo v € E, tem-se 
v=vi + +vr, vi=mi(A)qi(A)v. 
Pelo Teorema de Cayley-Hamilton, temos 
AP: quA)=(A-AD. TIA ADM 
jA 


=[[(A-ND"=pa(A)=0. 
j=1 


Logo Av; = 0, ou seja v; € E; para todo i = 1,...,r. Isto conclui a 
demonstração do teorema. 
Teorema A2.4. Os subespaços E; = NI(A — AID":] definidos no 
Teorema A2.8 são invariantes por qualquer operador B: E > E que 
comute com A. 

Demonstração: AB = BA > (A-ADB = B(A - AI) > 
> (A-ADYB = B(A-AI).Logove E > (A-ADUBy = 
B(A-ADRv=B.0=-0>BveE. 


























Corolário. Os subespaços Ey,..., Er são invariantes por A. 
Um bloco de Jordan n x n é uma matriz triangular inferior da 


forma 
A 
1 A 


B(A;n) = | 1 


E 
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onde os elementos da diagonal são todos iguais, os elementos ime- 
diatamente abaixo da diagonal são todos iguais a 1 e os demais ele- 
mentos são zeros. 

Diz-se que uma matriz está na forma canônica de Jordan quando 
ela é triangular inferior, com blocos de Jordan ao longo da diagonal e 
os demais elementos iguais a zero. Os blocos de Jordan devem estar 
agrupados consecutivamente em listas do tipo 


BA ki), BlAg o), BlA ks), 


onde k; +k; +--: +ks, = n; = multiplicidade algébrica do auto-valor 
A; da matriz dada. 

Por exemplo, dispondo os blocos B(A1;3), B(Aj;1) e B(As;2) ao 
longo da diagonal, obtemos uma matriz 6 x 6 na forma canônica de 
Jordan: 


A O 0 O 00 
* dg 0 4 O O 
O 1M 0 0 O 
O 0 0 À O O 
O O do O dz O 
O 0 0 0 1A 


Teorema A2.5. Para todo operador A: E — E num espaço vetorial 
complexo de dimensão finita, existe uma base na qual a matriz de A 
tem a forma canônica de Jordan. 


Demonstração: Seja E = E, &---& E, a decomposição assegurada 
pelo Teorema A2.3. O Teorema Al1.2 prova a existência da forma 
canônica de Jordan para operadores nilpotentes. Ora, para cada 
i=1,...,r,a restrição À — AI: E; — E; é nilpotente. Logo existe 
uma base V, c E; na qual a matriz de A —- AI: E > E tem a 
forma canônica de Jordan (com zeros na diagonal). Logo a matriz 
da restrição À = (A — Al) + Al: E; > E; tem a forma canônica de 
Jordan (com os elementos da diagonal todos iguais a A;). Segue-se 
que V=YU...UV, é uma base de E na qual a matriz de À tem a 
forma canônica de Jordan. [] 





Do ponto de vista matricial, o resultado que acabamos de provar 
significa que, para toda matriz quadrada complexa a, existe uma 
matriz (complexa) invertível p tal que p” !ap está na forma canônica 
de Jordan. 
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Exemplo A2.1. Vamos usar a forma canônica de Jordan para pro- 
var que toda matriz invertível possui uma raiz quadrada (complexa). 
Preliminarmente observamos que se x é uma raiz quadrada de 
pap então pxp ! é uma raiz quadrada de a, pois 


(pxp ')? =pxp 'pxp '=pxp !=p(p 'ap)p !'-a. 


Portanto, ao provar a existência da raiz quadrada de uma matriz 
invertível, não há perda de generalidade em supor que essa ma- 
triz está na forma canônica de Jordan, que é uma forma triangular 
particular. Em virtude da invertibilidade, os elementos da diagonal 
(auto-valores) são todos diferentes de zero. 

Trataremos explicitamente do caso 4 x 4, deixando para o leitor 
o caso 3 x 3 (mais simples) e o caso geral (mais complicado, porém 
suscetível da mesma abordagem). 

Temos então uma matriz da forma 


a 0 0 0 
apo oa 
lo O) fg] 


com a, c, e, g diferentes de zero, e procuramos uma matriz 


"0 6.0 

g= [4 2 00 

mm p OO 

q rs tt 

tal que x? — a. Ora, um cálculo simples nos dá 
x* 0 0 0 
ao ulx+z) 7 0 0 
“| mx+p)+ny n(z+p) pé 0|” 

gx+)+rmy+ms rlz+t)+ns sip+tt) É 


Portanto as incógnitas x, y, Z, m,n, Pp, q,T,s e t devem satisfazer 
as condições 


O v=d P=t p=e F=o 


(2) vulx+z7)=b, n(z+pJ=d, s(p+U=f, 
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(3) mix+p)+ny=0, rlz+t)+ns=0, 
(4) qix+Hry)+ryaAms=o. 


Como a, c, e, g são diferentes de zero, podemos escolher x, z, p, 
t tais que as igualdades (1) sejam satisfeitas e, além disso, se tenha 
x+z£0,z+pO,p+t0,x+p*0,z+tt*0ex+t0. Isto nos 
permite determinar y, n, s de modo a satisfazer as igualdades (2), 
em seguida obter m, r de modo que as igualdades (3) sejam válidas 
e, finalmente, usar (4) para determinar q. 


Observação: Uma matriz não-invertível pode não possuir raiz qua- 
drada. Este é o caso, por exemplo, da matriz 


a= [1 E 


E fácil ver que não existem números complexos x, y, z, t tais que a 


2 


. x Uy 
matriz x — e cumprax” = a. 


A3. A Decomposição A = N+D 


Nesta seção, mostraremos como visualizar a forma canônica de Jor- 
dan de modo intrínseco, exprimindo-a sob o ponto-de-vista de opera- 
dores, em vez de matrizes. 

A forma canônica de Jordan, estabelecida na seção anterior, mos- 
tra que, dado um operador A: E — E num espaço vetorial complexo 
de dimensão finita, existe uma base V c E na qual a matriz a de À é 
formada por blocos de Jordan ao longo da diagonal, sendo os blocos 
que correspondem ao mesmo auto-valor de A agrupados consecuti- 
vamente. Segue-se que a = n + d, onde d é uma matriz diagonal, 
os elementos dessa diagonal sendo os auto-valores de A repetidos 
de acordo com sua multiplicidade, e n é uma matriz triangular in- 
ferior nilpotente (logo os elementos de sua diagonal são todos iguais 
a zero) na qual os elementos imediatamente abaixo da diagonal são 
iguais a 1 ou a O e os demais elementos são nulos. 

Resulta imediatamente daí a decomposição A = N + D, onde 
D:E > E é o operador cuja matriz na base Véde N:E 5 Eéo 
operador nilpotente do qual n é a matriz na mesma base /. 
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Um operador D: E > E chama-se diagonalizável quando existe 
alguma base de E na qual a matriz de D é diagonal. Isto equi- 
vale a dizer que a referida base de E é formada por auto-vetores do 
operador D. 

Assim, acabamos de mostrar que, num espaço vetorial complexo 
de dimensão finita, todo operador A: E — E pode escrever-se como 
soma À = N + D de um operador nilpotente com um diagonalizável. 

Na notação do Teorema A2.3, N é o operador cuja restrição a cada 
subespaço E; coincide com A —A;I, enquanto D restrito a cada um dos 
E;s é igual a A;I. Como À — A;l e A;I comutam para todo i = 1,...,r, 
segue-se que ND = DN. 

Provaremos a seguir que esta é a única maneira de se escrever 
A =N+D com N nilpotente, D diagonalizável e ND = DN. 

Para maior clareza, destacaremos sob a forma de lemas dois fatos 
elementares que usaremos na demonstração dessa unicidade. 


Lema 1. A restrição de um operador diagonalizável D:E > E a 
um subespaço invariante F C E é ainda um operador diagonalizável 
D:FS E 


Demonstração: Seja V c E uma base formada por auto-vetores de 
D. Introduzimos em E um produto interno hermitiano, impondo que 
a base V seja ortonormal. Relativamente a esse produto interno, D 
é normal. Portanto a restrição D: F > F é um operador hermitiano, 
logo diagonalizável. (V. Exercício 15.19). 














Lema 2. A soma de dois operadores nilpotentes que comutam é 
ainda um operador nilpotente. 


Demonstração: Sejam M,N:E > Ecom MP =0,N9 =0e MN = 
NM. Esta comutatividade assegura que vale o binômio de Newton: 


Ria | | 
(MANPHI=S ú “minpras, 
1 
i=0 


No somatório acima, as parcelas com i > p são nulas porque, neste 
caso, M' — 0. Se, entretanto, tem-sei < pentãop + q-i> q, 
logo NP*I-t = 0, Assim as parcelas com i < p também são nulas e 
concluímos que (M + N)P*I = 0. 
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Teorema A3.1. Seja E um espaço vetorial complexo de dimensão 
finita. Para todo operador linear A: E > E, existe uma única decom- 
posição A = N+D com N: E > Enilpotente, D: E > E diagonalizável 
e ND = DN. 


Demonstração: Evidentemente, N e D comutam com A. Pelo 
Teorema A2.4, cada subespaço E; = N[(A— A; 1)"i] é invariante por N 
e por D. Parai = 1,...,r, sejam Ai, Ni, D;: E; — E; as restrições de 
A, Ne D ao subespaço E;. A igualdade A; = N;+ D; pode ser escrita 
como (A; —A;il) +AI = N;+4+D; ou, ainda, como 


(A - MI) —Ni=Di— AL (9) 


Pelo Lema 2, o operador (A; —A;1I) —N; é nilpotente e pelo Lema 1, D; 
é diagonalizável, logo D; — A;I é diagonalizável (pois qualquer vetor 
não-nulo é auto-vetor de A;l). Pela igualdade (*), esses operadores 
são, ao mesmo tempo, nilpotentes e diagonalizáveis, logo iguais a 
zero. Portanto vale N; = A;-AleD; =Alparai=1,...,r. Segue- 
se que N e D são os operadores anteriormente obtidos a partir do 
Teorema A2.3. [1] 
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Na sequência usual das disciplinas matemáticas que se estudam na 
universidade, a Álgebra Linear é pré-requisito para a Análise das 
funções de várias variáveis e para as Equações Diferenciais Ordiná- 
rias. Seguem-se duas referências: 


“É de se esperar que vetores, matrizes, transformações lineares, etc constituam 
a linguagem natural para tratar o Cálculo Diferencial pois, afinal de contas, este 
se baseia na idéia de aproximar, na vizinhança de cada ponto do seu domínio, uma 
função “arbitrária” por uma função linear (chamada sua derivada) e, a partir das 
propriedades desta (presumivelmente mais fáceis de constatar) obter informações 
sobre aquela”. 


E. L. Lima 


[1] E. L. Lima, Curso de Análise, vol. 2 (32edição.) Coleção Projeto 
Euclides, IMPA, 1989. 


A Álgebra Linear está presente em toda parte do estudo das 
funções reais de várias variáveis: na teoria das funções implícitas, 
nas integrais curvilíneas, na discussão dos pontos críticos (na qual 
as formas quadráticas desempenham o papel principal) e nas inte- 
grais de superfície, onde é reforçada por seu prolongamento natural, 
a Álgebra Multilinear. 


[2]M. Hirsch e S. Smale, Differential Equations, Dynamical Systems 
and Linear Algebra. Academic Press, 1974. 


Nestes últimos 20 anos, o texto de Hirsch/Smale firmou-se como 
uma das principais referências para uma introdução moderna ao es- 
tudo das equações diferenciais ordinárias e uma preparação para 
a importante área dos sistemas dinâmicos. Ele pressupõe conheci- 
mento de Análise a nível dos capítulos iniciais da referência 1 acima 
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e de Álgebra Linear a nível do presente livro. Mais de um terço 
do texto é dedicado às equações diferenciais lineares, o que leva 
os autores a desenvolver, de forma convincente, todo material de 
Álgebra Linear não tratado neste nosso livro. Na realidade, os au- 
tores afirmam que o estudo dos sistemas de equações diferenciais 
lineares com coeficientes constantes praticamente se identifica com 
um capítulo da Álgebra Linear. 


Vejamos agora algumas referências de livros sobre Algebra Li- 
near. 


Há poucas décadas eram raros, muito raros mesmo, os livros de 
Álgebra Linear destinados a estudantes de graduação. Hoje em dia 
há centenas deles, refletindo a enorme expansão do ensino desta 
disciplina aos mais variados cursos universitários. (Ver, a respeito, 
a citação de I. Kaplansky abaixo.) 


Aqueles que mencionarei representam uma amostra, extrema- 
mente restrita, de três tipos: os livros onde aprendi a matéria, os 
que podem servir de leitura colateral e os que oferecem alternativas 
para estudos posteriores. À priori, aceito a acusação de parcialidade 
nas escolhas. Afinal, de gustibus et coloribus... 


“Tt is desirable to have at hand not merely the formal operations with matrices, 
but also the (often neglected) interpretation of the matrices by linear transforma- 
tions”. 

G. Birkhoff e S. MacLane 


[3] Garrett Birkhoff e Saunders MacLane, A Survey of Modern Alge- 
bra. (Macmillan, 1941. Revised edition 1953.) 


Birkhoff/MacLane é uma das mais bem sucedidas introduções à 
Álgebra Moderna já escritas. Trinta e oito por cento do livro é de- 
dicado à Álgebra Linear. Embora a exposição seja feita a partir dos 
conceitos de espaço vetorial e transformação linear, a ênfase domi- 
nante é posta nas matrizes e suas “formas canônicas”, especialmente 
matrizes de formas quadráticas. O estilo é ameno e ligeiro, bastante 
agradável. O leitor logo se acostumará com a notação vA, em vez de 
Av, usada pelos autores. 
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“That Hilbert space theory and elementary matrix theory are intimately asso- 
ciated came as a surprise to me and to many colleagues of my generation only after 
studying the two subjects separately. This is deplorable... I present this little book 
in an attempt to remedy the situation” 

Paul R. Halmos 


[4] Paul R. Halmos, Finite Dimensional Vector Spaces. (Princeton 
Univ. Press 1942. Revised edition: Van Nostrand, 1958. Tradução 
brasileira: Editora Campus, 1978.) 


O livro de Halmos é outro best-seller. Nele, o autor conversa 
com o leitor e procura motivar, com analogias, os conceitos e as 
proposições, tudo isso feito com clareza e coerência lógica. Há uma 
grande preocupação em dar definições e demonstrações sem utilizar 
coordenadas. Isto é feito com o propósito admitido de preparar a ca- 
minho para os espaços de dimensão infinita, estudados em Análise 
Funcional. Só que muitas vezes esse purismo se torna artificial. 
Além disso, com vistas a diversas aplicações, a familiaridade do es- 
tudante com bases e coordenadas seria de grande utilidade. 

Os livros acima, na ordem citada, me serviram de cartilhas de 
Álgebra Linear, como a tantos estudantes de várias gerações por 
todo o mundo. Eles contêm visões complementares sobre o assunto 
e sobre a maneira de ensiná-lo. 


“Dealing with vector spaces in the abstract also saves effort. The general the- 
ory of vector spaces includes not only the vectors and matrices discussed in Chap- 
ters 1 and 2 but also sets of real- and complex-valued functions of a real variable 
and other more exotic mathematical objects. A fact which has been proved once 
and for all in the general theory applies to a wide range of particular cases. That is 
why it is worth investing some intellectual effort in understanding abstract linear 
algebra”. 

D.H. Griffel 


[5] D. H. Griffel, Linear Algebra: A First Course and Applications (2 
vols). (Ellis Horwood Limited, 1989.) 


O livro de Griffel é escrito para estudantes não-matemáticos que 
deverão usar Algebra Linear em suas carreiras. Ele emprega predo- 
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minantemente matrizes e R” em vez de transformações lineares e 
espaços vetoriais porém, conforme a advertência acima citada, oca- 
sionalmente se rende à conveniência de adotar uma atitude mais 
adequada. Trata-se de um livro de grande simplicidade, muito claro 
e bem organizado, com um sabor nitidamente “aplicado”. Contém 
alguns erros matemáticos engraçados (como, por exemplo, “provar” 
que toda matriz anti-simétrica tem determinante zero ou afirmar 
que, pelo Teorema de Cayley-Hamilton, a exponencial de qualquer 
matriz reduz-se a um polinômio nessa matriz). Tais erros são pou- 
cos, não interferem no mérito geral e deverão ser corrigidos em pró- 
ximas edições. São até instrutivos, inclusive para mostrar ao leitor o 
que pode esperar no futuro ao ler alguns livros de Matemática Apli- 
cada. 


“The solution to each problem immediately follows the statement of the pro- 
blem. However, you may wish to try to solve the problem yourself before reading 
the given solution. In fact, even after reading the solution, you should try to re- 
solve the problem without consulting the text. Used thus, “3000 Solved Problems 
in Linear Algebra” can serve as a supplement to any course in linear algebra, or 
even as an independent refresher course”. 

S. Lipschutz 


[6] Seymour Lipschutz, Schaum's solved problems series: 83000 sol- 
ved problems in Linear Algebra. McGraw-Hill Book Company, 1989. 


A bem-sucedida série Schaum de livros de problemas se baseia 
numa idéia tipo ovo-de-Colombo: em vez de disputar sua adoção con- 
tra tantos e tão fortes competidores, esses livros-texto se disfarçam 
em coleções de problemas e assim convivem pacificamente com seus 
rivais, sendo adquiridos pelos estudantes, mesmo quando não reco- 
mendados pelos professores, como fontes suplementares de exercí- 
cios. De um modo geral (e isto se aplica ao livro de Lipschutz) eles 
contêm uma boa lista de problemas rotineiros, que não exigem gran- 
des rasgos de imaginação. Mas, principalmente porque são acompa- 
nhados de solução, esses exercícios são uma ajuda valiosa para os 
alunos que necessitam um esforço adicional a fim de acompanhar o 
curso. Existe um livro análogo, também de Lipschutz, chamado “Li- 
near Algebra”, que foi traduzido para o português e publicado pela 
McGraw-Hill do Brasil, em 1972. 
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Os livros [5]. e [6]. acima se enquadram na categoria de leitura 
colateral. Seguem-se três referências a livros que constituem opções 
para a continuação deste texto. 


“Matrix theory can be studied with no mention of linear spaces and most of the 
results in this book are of such a nature. However, the introduction of linear spaces 
and the role of matrices in defining or representing linear transformations on such 
spaces add considerably to our insight. Most important, perhaps, the notions of 
linear spaces and linear transformations give a geometrical basis to matrix theory, 
which aids both in understanding, as well as in suggesting proofs and new results. 

J. Ortega 


[7] James Ortega, Matrix Theory. A Second Course. Plenum Press, 
1987. 


A economia de pensamento e notação, bem como a riqueza ima- 
ginativa que provém do uso da linguagem geométrica resultam do 
emprego judicioso das noções de espaço vetorial e transformação li- 
near. Ortega tira grande proveito desse ponto de vista intrínseco 
e consegue escrever um livro que, em meras 250 páginas, faz uma 
revisão dos princípios básicos da Álgebra Linear e desenvolve, com 
notável eficiência, uma exposição sobre tópicos avançados da álgebra 
das matrizes, que pode ser útil tanto para o matemático puro como 
para aqueles que se interessam de modo inteligente pelo cálculo nu- 
mérico matricial. 


“Linear Algebra, like motherhood, has become a sacred cow. It is taught eve- 
rywhere; it is reaching down into the high schools; it is jostling calculus for the 
right to be taught first”. 

I. Kaplansky 


[8] Irving Kaplansky, Linear Algebra and Geometry. Chelsea, 1969. 


Kaplansky é um consagrado expositor. Na Universidade de Chi- 
cago (onde era colega de MacLane e Halmos) suas aulas eram fa- 
mosas pela elegância das demonstrações e pelo notável poder de 
síntese. Estas qualidades estão presentes neste livro. Nele, o autor 
oferece uma alternativa para um segundo curso de Álgebra Linear, 
como fundamento básico da Geometria, esta última vista em toda a 
sua generalidade. 


340 | Indicações Bibliográficas 


“As a very simple example the reader should think of the principal axis theo- 
rem (spectral theorem) for R” which says that given a self-adjoint transformation, 
one can choose an orthonormal basis in R” so that the matrix of that transforma- 
tion in that basis is diagonal. That is, if one chooses the right isomorphic copy of 
R” (change of basis) then the operator becomes especially simple. As the reader 
will see, this example is the first note of a rather long simphony”. 

M. Reed e B. Simon 


[9] M. Reed/B. Simon, Methods of Mathematical Physics, vol. T: 
Functional Analysis. (Revised Edition, Academic Press, 1980.) 


Ao mencionar o bem conhecido texto de Reed/Simon, minha in- 
tenção é apresentar um livro de Análise Funcional, uma área da Ma- 
temática onde tudo se passa dentro de espaços vetoriais. Há muitos 
bons livros sobre este assunto. (Um exemplo à mão é o excelente 
“Operadores Auto-Adjuntos e Equações Diferenciais Parciais”, de 
Javier Thayer, publicado no Projeto Euclides do IMPA.) A escolha de 
Reed/Simon se deve não apenas às suas boas qualidades intrínsecas 
como também ao fato de que exibe a Análise Funcional (portanto os 
espaços vetoriais) como porta de entrada para a Física Matemática. 

Uma palavra sobre pré-requisitos: o livro de Ortega está ao al- 
cance imediato de quem leu o presente texto. Kaplansky requer um 
conhecimento elementar de corpos, a nível de um curso introdutório 
de Álgebra. Reed/Simon (ou qualquer outro livro de Análise Fun- 
cional) pressupõe noções básicas de Análise, Teoria da Integral e 
Equações Diferenciais. 


[10] Ralph Costa Teixeira, Álgebra Linear, exercícios e soluções. 
(Coleção Matemática Universitária, IMPA, 2009.) 


O livro de Ralph Costa Teixeira contém as soluções dos 594 exer- 
cícios propostos no presente texto. Na verdade, o total é bem maior 
do que seiscentos, pois vários desses exercícios são múltiplos. Além 
das soluções, todas completas e elegantemente apresentadas, cada 
capítulo tem início com a revisão dos conceitos a serem tratados, a 
discussão de simples exemplos adicionais e o destaque de algumas 
proposições referentes ao tema estudado. 
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A coleção 


A coleção Matemática Universi- 
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